diff --git a/aaanalysis/data_loader/__pycache__/data_loader.cpython-39.pyc b/aaanalysis/data_loader/__pycache__/data_loader.cpython-39.pyc
index a16d349a..77ec981e 100644
Binary files a/aaanalysis/data_loader/__pycache__/data_loader.cpython-39.pyc and b/aaanalysis/data_loader/__pycache__/data_loader.cpython-39.pyc differ
diff --git a/aaanalysis/data_loader/data_loader.py b/aaanalysis/data_loader/data_loader.py
index 1b218681..a423c985 100644
--- a/aaanalysis/data_loader/data_loader.py
+++ b/aaanalysis/data_loader/data_loader.py
@@ -63,8 +63,8 @@ def load_dataset(name: str = "INFO",
     """
     Load protein benchmarking datasets.
 
-    The benchmarks are  distinguished into amino acid ('AA'), domain ('DOM'), and sequence ('SEQ') level
-    datasets. Use default settings (name='INFO') of an overview table. Detailed analysis is in :cite:`Breimann23a`.
+    The benchmarks are categorized into amino acid ('AA'), domain ('DOM'), and sequence ('SEQ') level
+    datasets. Use default settings (``name='INFO'``) for an overview table. Detailed analysis is in [Breimann23a]_.
 
     Parameters
     ----------
@@ -88,8 +88,8 @@ def load_dataset(name: str = "INFO",
 
     Returns
     -------
-    df_seq
-        Dataframe with the selected sequence dataset.
+    pd.DataFrame
+        Dataframe (df_seq) containing the selected sequence dataset.
 
     Notes
     -----
diff --git a/docs/build/doctrees/environment.pickle b/docs/build/doctrees/environment.pickle
index a64cf533..727bdbc2 100644
Binary files a/docs/build/doctrees/environment.pickle and b/docs/build/doctrees/environment.pickle differ
diff --git a/docs/build/doctrees/generated/aaanalysis.AAclust.doctree b/docs/build/doctrees/generated/aaanalysis.AAclust.doctree
index 3e7f4b92..7fd62759 100644
Binary files a/docs/build/doctrees/generated/aaanalysis.AAclust.doctree and b/docs/build/doctrees/generated/aaanalysis.AAclust.doctree differ
diff --git a/docs/build/doctrees/generated/aaanalysis.CPP.doctree b/docs/build/doctrees/generated/aaanalysis.CPP.doctree
index f6668828..3306522b 100644
Binary files a/docs/build/doctrees/generated/aaanalysis.CPP.doctree and b/docs/build/doctrees/generated/aaanalysis.CPP.doctree differ
diff --git a/docs/build/doctrees/generated/aaanalysis.CPPPlot.doctree b/docs/build/doctrees/generated/aaanalysis.CPPPlot.doctree
index c92f93d3..8a761868 100644
Binary files a/docs/build/doctrees/generated/aaanalysis.CPPPlot.doctree and b/docs/build/doctrees/generated/aaanalysis.CPPPlot.doctree differ
diff --git a/docs/build/doctrees/generated/aaanalysis.SequenceFeature.doctree b/docs/build/doctrees/generated/aaanalysis.SequenceFeature.doctree
index 1ad1d937..c463fb1a 100644
Binary files a/docs/build/doctrees/generated/aaanalysis.SequenceFeature.doctree and b/docs/build/doctrees/generated/aaanalysis.SequenceFeature.doctree differ
diff --git a/docs/build/doctrees/generated/aaanalysis.dPULearn.doctree b/docs/build/doctrees/generated/aaanalysis.dPULearn.doctree
index 37b84454..83c7d59d 100644
Binary files a/docs/build/doctrees/generated/aaanalysis.dPULearn.doctree and b/docs/build/doctrees/generated/aaanalysis.dPULearn.doctree differ
diff --git a/docs/build/doctrees/generated/aaanalysis.load_dataset.doctree b/docs/build/doctrees/generated/aaanalysis.load_dataset.doctree
index 6bf538ef..c8e506a9 100644
Binary files a/docs/build/doctrees/generated/aaanalysis.load_dataset.doctree and b/docs/build/doctrees/generated/aaanalysis.load_dataset.doctree differ
diff --git a/docs/build/doctrees/generated/aaanalysis.load_scales.doctree b/docs/build/doctrees/generated/aaanalysis.load_scales.doctree
index bce2a1d6..7cb77afa 100644
Binary files a/docs/build/doctrees/generated/aaanalysis.load_scales.doctree and b/docs/build/doctrees/generated/aaanalysis.load_scales.doctree differ
diff --git a/docs/build/doctrees/generated/aaanalysis.plot_gcfs.doctree b/docs/build/doctrees/generated/aaanalysis.plot_gcfs.doctree
index 7eb49833..584a1de2 100644
Binary files a/docs/build/doctrees/generated/aaanalysis.plot_gcfs.doctree and b/docs/build/doctrees/generated/aaanalysis.plot_gcfs.doctree differ
diff --git a/docs/build/doctrees/generated/aaanalysis.plot_get_cdict.doctree b/docs/build/doctrees/generated/aaanalysis.plot_get_cdict.doctree
index 68cf2afa..223d6a9a 100644
Binary files a/docs/build/doctrees/generated/aaanalysis.plot_get_cdict.doctree and b/docs/build/doctrees/generated/aaanalysis.plot_get_cdict.doctree differ
diff --git a/docs/build/doctrees/generated/aaanalysis.plot_get_cmap.doctree b/docs/build/doctrees/generated/aaanalysis.plot_get_cmap.doctree
index f401ddab..e571284f 100644
Binary files a/docs/build/doctrees/generated/aaanalysis.plot_get_cmap.doctree and b/docs/build/doctrees/generated/aaanalysis.plot_get_cmap.doctree differ
diff --git a/docs/build/doctrees/generated/aaanalysis.plot_set_legend.doctree b/docs/build/doctrees/generated/aaanalysis.plot_set_legend.doctree
index f5d493ac..957b6994 100644
Binary files a/docs/build/doctrees/generated/aaanalysis.plot_set_legend.doctree and b/docs/build/doctrees/generated/aaanalysis.plot_set_legend.doctree differ
diff --git a/docs/build/doctrees/generated/aaanalysis.plot_settings.doctree b/docs/build/doctrees/generated/aaanalysis.plot_settings.doctree
index a7b4da11..2d611bd2 100644
Binary files a/docs/build/doctrees/generated/aaanalysis.plot_settings.doctree and b/docs/build/doctrees/generated/aaanalysis.plot_settings.doctree differ
diff --git a/docs/build/html/.buildinfo b/docs/build/html/.buildinfo
index 3bbfcdee..eb42c979 100644
--- a/docs/build/html/.buildinfo
+++ b/docs/build/html/.buildinfo
@@ -1,4 +1,4 @@
 # Sphinx build info version 1
 # This file hashes the configuration used when building these files. When it is not found, a full rebuild will be done.
-config: 97d403b4e986b8364b888ee4b33cf00e
+config: 58b28218296ef1ff785a2881fa4b8801
 tags: 645f666f9bcd5a90fca523b33c5a78b7
diff --git a/docs/build/html/_index/badges.html b/docs/build/html/_index/badges.html
index 6af97eb0..c2152d89 100644
--- a/docs/build/html/_index/badges.html
+++ b/docs/build/html/_index/badges.html
@@ -95,7 +95,7 @@
       <li><a href="../index.html" class="icon icon-home"></a></li>
       <li class="breadcrumb-item active">&lt;no title&gt;</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/_index/badges.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/_index/badges.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
diff --git a/docs/build/html/_index/overview.html b/docs/build/html/_index/overview.html
index 49ea238e..a2bd697a 100644
--- a/docs/build/html/_index/overview.html
+++ b/docs/build/html/_index/overview.html
@@ -95,7 +95,7 @@
       <li><a href="../index.html" class="icon icon-home"></a></li>
       <li class="breadcrumb-item active">&lt;no title&gt;</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/_index/overview.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/_index/overview.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
diff --git a/docs/build/html/_index/tables.html b/docs/build/html/_index/tables.html
index c7bee5ba..11f186a6 100644
--- a/docs/build/html/_index/tables.html
+++ b/docs/build/html/_index/tables.html
@@ -102,7 +102,7 @@
       <li><a href="../index.html" class="icon icon-home"></a></li>
       <li class="breadcrumb-item active">Tables</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/_index/tables.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/_index/tables.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
diff --git a/docs/build/html/_index/usage_principles/data_loading.html b/docs/build/html/_index/usage_principles/data_loading.html
index b71c77ac..9bf5b8c9 100644
--- a/docs/build/html/_index/usage_principles/data_loading.html
+++ b/docs/build/html/_index/usage_principles/data_loading.html
@@ -95,7 +95,7 @@
       <li><a href="../../index.html" class="icon icon-home"></a></li>
       <li class="breadcrumb-item active">Data Loading</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../../_sources/_index/usage_principles/data_loading.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/_index/usage_principles/data_loading.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
diff --git a/docs/build/html/_modules/aaanalysis/aaclust/aaclust.html b/docs/build/html/_modules/aaanalysis/aaclust/aaclust.html
deleted file mode 100644
index e01099cb..00000000
--- a/docs/build/html/_modules/aaanalysis/aaclust/aaclust.html
+++ /dev/null
@@ -1,737 +0,0 @@
-<!DOCTYPE html>
-<html class="writer-html5" lang="en" >
-<head>
-  <meta charset="utf-8" />
-  <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-  <title>aaanalysis.aaclust.aaclust &mdash; AAanalysis</title>
-      <link rel="stylesheet" href="../../../_static/pygments.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/css/theme.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/copybutton.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/plot_directive.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/css/style.css" type="text/css" />
-    <link rel="shortcut icon" href="../../../_static/logo_small.png"/>
-  <!--[if lt IE 9]>
-    <script src="../../../_static/js/html5shiv.min.js"></script>
-  <![endif]-->
-  
-        <script data-url_root="../../../" id="documentation_options" src="../../../_static/documentation_options.js"></script>
-        <script src="../../../_static/jquery.js"></script>
-        <script src="../../../_static/underscore.js"></script>
-        <script src="../../../_static/_sphinx_javascript_frameworks_compat.js"></script>
-        <script src="../../../_static/doctools.js"></script>
-        <script src="../../../_static/sphinx_highlight.js"></script>
-        <script src="../../../_static/clipboard.min.js"></script>
-        <script src="../../../_static/copybutton.js"></script>
-        <script src="../../../_static/design-tabs.js"></script>
-    <script src="../../../_static/js/theme.js"></script>
-    <link rel="index" title="Index" href="../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../search.html" /> 
-</head>
-
-<body class="wy-body-for-nav"> 
-  <div class="wy-grid-for-nav">
-    <nav data-toggle="wy-nav-shift" class="wy-nav-side">
-      <div class="wy-side-scroll">
-        <div class="wy-side-nav-search"  style="background: #343131" >
-            <a href="../../../index.html">
-            <img src="../../../_static/logo_big_trans.png" class="logo" alt="Logo"/>
-          </a>
-              <div class="version">
-                latest
-              </div>
-<div role="search">
-  <form id="rtd-search-form" class="wy-form" action="../../../search.html" method="get">
-    <input type="text" name="q" placeholder="Search docs" />
-    <input type="hidden" name="check_keywords" value="yes" />
-    <input type="hidden" name="area" value="default" />
-  </form>
-</div>
-        </div><div class="wy-menu wy-menu-vertical" data-spy="affix" role="navigation" aria-label="Navigation menu">
-              <p class="caption" role="heading"><span class="caption-text">OVERVIEW</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/introduction.html">Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/usage_principles.html">Usage Principles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/CONTRIBUTING_COPY.html">Contributing</a></li>
-</ul>
-<p class="caption" role="heading"><span class="caption-text">EXAMPLES</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../tutorials.html">Tutorials</a></li>
-</ul>
-<p class="caption" role="heading"><span class="caption-text">REFERENCES</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../api.html">API</a></li>
-</ul>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../_index/tables.html">Tables</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/references.html">References</a></li>
-</ul>
-
-        </div>
-      </div>
-    </nav>
-
-    <section data-toggle="wy-nav-shift" class="wy-nav-content-wrap"><nav class="wy-nav-top" aria-label="Mobile navigation menu"  style="background: #343131" >
-          <i data-toggle="wy-nav-top" class="fa fa-bars"></i>
-          <a href="../../../index.html">AAanalysis</a>
-      </nav>
-
-      <div class="wy-nav-content">
-        <div class="rst-content">
-          <div role="navigation" aria-label="Page navigation">
-  <ul class="wy-breadcrumbs">
-      <li><a href="../../../index.html" class="icon icon-home"></a></li>
-          <li class="breadcrumb-item"><a href="../../index.html">Module code</a></li>
-      <li class="breadcrumb-item active">aaanalysis.aaclust.aaclust</li>
-      <li class="wy-breadcrumbs-aside">
-      </li>
-  </ul>
-  <hr/>
-</div>
-          <div role="main" class="document" itemscope="itemscope" itemtype="http://schema.org/Article">
-           <div itemprop="articleBody">
-             
-  <h1>Source code for aaanalysis.aaclust.aaclust</h1><div class="highlight"><pre>
-<span></span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">This is a script for the AAclust clustering wrapper method.</span>
-<span class="sd">&quot;&quot;&quot;</span>
-<span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
-<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-<span class="kn">from</span> <span class="nn">collections</span> <span class="kn">import</span> <span class="n">OrderedDict</span>
-<span class="kn">from</span> <span class="nn">sklearn.metrics.pairwise</span> <span class="kn">import</span> <span class="n">pairwise_distances</span>
-<span class="kn">from</span> <span class="nn">sklearn.cluster</span> <span class="kn">import</span> <span class="n">KMeans</span>
-
-<span class="kn">import</span> <span class="nn">aaanalysis.utils</span> <span class="k">as</span> <span class="nn">ut</span>
-
-
-<span class="c1"># I Helper Functions</span>
-<span class="c1"># Obtain centroids and medoids</span>
-<span class="k">def</span> <span class="nf">cluster_center</span><span class="p">(</span><span class="n">X</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute cluster center (i.e., arithmetical mean over all data points/observations of a cluster)&quot;&quot;&quot;</span>
-    <span class="k">return</span> <span class="n">X</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)[</span><span class="n">np</span><span class="o">.</span><span class="n">newaxis</span><span class="p">,</span> <span class="p">:]</span>
-
-
-<span class="k">def</span> <span class="nf">get_cluster_centers</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Obtain cluster centers and their labels&quot;&quot;&quot;</span>
-    <span class="n">center_labels</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">OrderedDict</span><span class="o">.</span><span class="n">fromkeys</span><span class="p">(</span><span class="n">labels</span><span class="p">))</span>
-    <span class="n">list_masks</span> <span class="o">=</span> <span class="p">[[</span><span class="kc">True</span> <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="n">label</span> <span class="k">else</span> <span class="kc">False</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">]</span> <span class="k">for</span> <span class="n">label</span> <span class="ow">in</span> <span class="n">center_labels</span><span class="p">]</span>
-    <span class="n">centers</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">([</span><span class="n">cluster_center</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="n">mask</span><span class="p">])</span> <span class="k">for</span> <span class="n">mask</span> <span class="ow">in</span> <span class="n">list_masks</span><span class="p">])</span><span class="o">.</span><span class="n">round</span><span class="p">(</span><span class="mi">3</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">centers</span><span class="p">,</span> <span class="n">center_labels</span>
-
-
-<span class="k">def</span> <span class="nf">_cluster_medoid</span><span class="p">(</span><span class="n">X</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Obtain cluster medoids (i.e., scale closest to cluster center used as representative scale for a cluster)&quot;&quot;&quot;</span>
-    <span class="c1"># Create new array with cluster center and given</span>
-    <span class="n">center_X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">([</span><span class="n">cluster_center</span><span class="p">(</span><span class="n">X</span><span class="p">),</span> <span class="n">X</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-    <span class="c1"># Get index for scale with highest correlation with cluster center</span>
-    <span class="n">ind_max</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">corrcoef</span><span class="p">(</span><span class="n">center_X</span><span class="p">)[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">:]</span><span class="o">.</span><span class="n">argmax</span><span class="p">()</span>
-    <span class="k">return</span> <span class="n">ind_max</span>
-
-
-<span class="k">def</span> <span class="nf">get_cluster_medoids</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Obtain cluster medoids and their labels&quot;&quot;&quot;</span>
-    <span class="n">unique_labels</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">OrderedDict</span><span class="o">.</span><span class="n">fromkeys</span><span class="p">(</span><span class="n">labels</span><span class="p">))</span>
-    <span class="n">list_masks</span> <span class="o">=</span> <span class="p">[[</span><span class="kc">True</span> <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="n">label</span> <span class="k">else</span> <span class="kc">False</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">]</span> <span class="k">for</span> <span class="n">label</span> <span class="ow">in</span> <span class="n">unique_labels</span><span class="p">]</span>
-    <span class="n">list_ind_max</span> <span class="o">=</span> <span class="p">[</span><span class="n">_cluster_medoid</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="n">mask</span><span class="p">])</span> <span class="k">for</span> <span class="n">mask</span> <span class="ow">in</span> <span class="n">list_masks</span><span class="p">]</span>
-    <span class="n">indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">labels</span><span class="p">)))</span>
-    <span class="n">medoid_ind</span> <span class="o">=</span> <span class="p">[</span><span class="n">indices</span><span class="p">[</span><span class="n">m</span><span class="p">][</span><span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">m</span><span class="p">,</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">list_masks</span><span class="p">,</span> <span class="n">list_ind_max</span><span class="p">)]</span>
-    <span class="n">medoid_labels</span> <span class="o">=</span> <span class="p">[</span><span class="n">labels</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">medoid_ind</span><span class="p">]</span>
-    <span class="n">medoids</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">,</span> <span class="p">:]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">medoid_ind</span><span class="p">])</span>
-    <span class="k">return</span> <span class="n">medoids</span><span class="p">,</span> <span class="n">medoid_labels</span><span class="p">,</span> <span class="n">medoid_ind</span>
-
-
-<span class="c1"># Compute minimum correlation on center or all scales</span>
-<span class="k">def</span> <span class="nf">_min_cor_center</span><span class="p">(</span><span class="n">X</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Get minimum for correlation of all columns with cluster center, defined as the mean values</span>
-<span class="sd">    for each amino acid over all scales.&quot;&quot;&quot;</span>
-    <span class="c1"># Create new matrix including cluster center</span>
-    <span class="n">center_X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">([</span><span class="n">cluster_center</span><span class="p">(</span><span class="n">X</span><span class="p">),</span> <span class="n">X</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-    <span class="c1"># Get minimum correlation with mean values</span>
-    <span class="n">min_cor</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">corrcoef</span><span class="p">(</span><span class="n">center_X</span><span class="p">)[</span><span class="mi">0</span><span class="p">,</span> <span class="p">]</span><span class="o">.</span><span class="n">min</span><span class="p">()</span>
-    <span class="k">return</span> <span class="n">min_cor</span>
-
-
-<span class="k">def</span> <span class="nf">_min_cor_all</span><span class="p">(</span><span class="n">X</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Get minimum for pair-wise correlation of all columns in given matrix.&quot;&quot;&quot;</span>
-    <span class="c1"># Get minimum correlations minimum/ maximum distance for pair-wise comparisons</span>
-    <span class="n">min_cor</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">corrcoef</span><span class="p">(</span><span class="n">X</span><span class="p">)</span><span class="o">.</span><span class="n">min</span><span class="p">()</span>
-    <span class="k">return</span> <span class="n">min_cor</span>
-
-
-<span class="k">def</span> <span class="nf">get_min_cor</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">on_center</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Compute minimum pair-wise correlation or correlation with cluster center for each cluster label</span>
-<span class="sd">    and return minimum of obtained cluster minimums.&quot;&quot;&quot;</span>
-    <span class="n">f</span> <span class="o">=</span> <span class="n">_min_cor_center</span> <span class="k">if</span> <span class="n">on_center</span> <span class="k">else</span> <span class="n">_min_cor_all</span>
-    <span class="k">if</span> <span class="n">labels</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="k">return</span> <span class="n">f</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-    <span class="c1"># Minimum correlations for each cluster (with center or all scales)</span>
-    <span class="n">unique_labels</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">OrderedDict</span><span class="o">.</span><span class="n">fromkeys</span><span class="p">(</span><span class="n">labels</span><span class="p">))</span>
-    <span class="n">list_masks</span> <span class="o">=</span> <span class="p">[[</span><span class="kc">True</span> <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="n">label</span> <span class="k">else</span> <span class="kc">False</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">]</span> <span class="k">for</span> <span class="n">label</span> <span class="ow">in</span> <span class="n">unique_labels</span><span class="p">]</span>
-    <span class="n">list_min_cor</span> <span class="o">=</span> <span class="p">[</span><span class="n">f</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="n">mask</span><span class="p">])</span> <span class="k">for</span> <span class="n">mask</span> <span class="ow">in</span> <span class="n">list_masks</span><span class="p">]</span>
-    <span class="c1"># Minimum for all clusters</span>
-    <span class="n">min_cor</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">list_min_cor</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">min_cor</span>
-
-
-<span class="c1"># Get maximum distance on center or all scales</span>
-<span class="k">def</span> <span class="nf">get_max_dist</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">on_center</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">metric</span><span class="o">=</span><span class="s2">&quot;euclidean&quot;</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span>
-    <span class="c1"># Maximum distance for cluster</span>
-    <span class="k">if</span> <span class="n">on_center</span><span class="p">:</span>
-        <span class="c1"># Create new matrix including cluster center</span>
-        <span class="n">center_X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">([</span><span class="n">cluster_center</span><span class="p">(</span><span class="n">X</span><span class="p">),</span> <span class="n">X</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-        <span class="c1"># Get maximum distance with mean values</span>
-        <span class="n">max_dist</span> <span class="o">=</span> <span class="n">pairwise_distances</span><span class="p">(</span><span class="n">center_X</span><span class="p">,</span> <span class="n">metric</span><span class="o">=</span><span class="n">metric</span><span class="p">)[</span><span class="mi">0</span><span class="p">,</span> <span class="p">]</span><span class="o">.</span><span class="n">max</span><span class="p">()</span>
-    <span class="k">else</span><span class="p">:</span>
-        <span class="c1"># Get maximum distance for pair-wise comparisons</span>
-        <span class="n">max_dist</span> <span class="o">=</span> <span class="n">pairwise_distances</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">metric</span><span class="o">=</span><span class="n">metric</span><span class="p">)</span><span class="o">.</span><span class="n">max</span><span class="p">()</span>
-    <span class="k">return</span> <span class="n">max_dist</span>
-
-
-<span class="c1"># II Main Functions</span>
-<span class="c1"># AAclust algorithm steps (estimate lower bound for n_clusters -&gt; optimization of n_clusters -&gt; merge clusters)</span>
-<span class="c1"># 1. Step (Estimation of n clusters)</span>
-<span class="k">def</span> <span class="nf">estimate_lower_bound_n_clusters</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">model</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">model_kwargs</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">min_th</span><span class="o">=</span><span class="mf">0.6</span><span class="p">,</span> <span class="n">on_center</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Estimate the lower bound of the number of clusters (k).</span>
-
-<span class="sd">    This function estimates the lower bound of the number of clusters by testing a range</span>
-<span class="sd">    between 10% and 90% of all observations, incrementing in 10% steps.</span>
-
-<span class="sd">    Parameters</span>
-<span class="sd">    ----------</span>
-<span class="sd">    X : array-like, shape (n_samples, n_features)</span>
-<span class="sd">        Feature matrix where `n_samples` is the number of samples and `n_features` is the number of features.</span>
-<span class="sd">    model : callable, optional</span>
-<span class="sd">        k-based clustering model to use.</span>
-<span class="sd">    model_kwargs : dict, optional</span>
-<span class="sd">        Dictionary of keyword arguments to pass to the clustering model.</span>
-<span class="sd">    min_th : float, optional, default = 0.6</span>
-<span class="sd">        Minimum threshold of within-cluster Pearson correlation required for a valid clustering.</span>
-<span class="sd">    on_center : bool, optional, default = True</span>
-<span class="sd">        Whether the minimum correlation is computed for all observations within a cluster</span>
-<span class="sd">        or just for the cluster center.</span>
-
-<span class="sd">    Returns</span>
-<span class="sd">    -------</span>
-<span class="sd">    n_clusters : int</span>
-<span class="sd">        Estimated lower bound for the number of clusters (k).</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="n">f</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">c</span><span class="p">:</span> <span class="n">get_min_cor</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="n">model</span><span class="p">(</span><span class="n">n_clusters</span><span class="o">=</span><span class="n">c</span><span class="p">,</span> <span class="o">**</span><span class="n">model_kwargs</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">)</span><span class="o">.</span><span class="n">labels_</span><span class="p">,</span> <span class="n">on_center</span><span class="o">=</span><span class="n">on_center</span><span class="p">)</span>
-    <span class="c1"># Create range between 10% and 90% of all scales (10% steps) as long as minimum correlation is lower than threshold</span>
-    <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
-    <span class="n">nclust_mincor</span> <span class="o">=</span> <span class="p">[(</span><span class="mi">1</span><span class="p">,</span> <span class="n">f</span><span class="p">(</span><span class="mi">1</span><span class="p">))]</span>
-    <span class="n">step_number</span> <span class="o">=</span> <span class="mi">40</span>
-    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">step_number</span><span class="p">,</span> <span class="mi">1</span><span class="p">):</span>
-        <span class="n">n_clusters</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="nb">int</span><span class="p">(</span><span class="n">n_samples</span><span class="o">*</span><span class="n">i</span><span class="o">/</span><span class="n">step_number</span><span class="p">))</span>    <span class="c1"># n cluster in 2.5% steps</span>
-        <span class="n">min_cor</span> <span class="o">=</span> <span class="n">f</span><span class="p">(</span><span class="n">n_clusters</span><span class="p">)</span>
-        <span class="k">if</span> <span class="n">min_cor</span> <span class="o">&lt;</span> <span class="n">min_th</span><span class="p">:</span>   <span class="c1"># Save only lower bounds</span>
-            <span class="n">nclust_mincor</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">n_clusters</span><span class="p">,</span> <span class="n">min_cor</span><span class="p">))</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="k">break</span>
-    <span class="c1"># Select second highest lower bound (highest lower bound is faster but might surpass true bound)</span>
-    <span class="n">nclust_mincor</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">key</span><span class="o">=</span><span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">reverse</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-    <span class="n">n_clusters</span> <span class="o">=</span> <span class="n">nclust_mincor</span><span class="p">[</span><span class="mi">1</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">nclust_mincor</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span> <span class="k">else</span> <span class="n">nclust_mincor</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span>  <span class="c1"># Otherwise, only existing one</span>
-    <span class="k">return</span> <span class="n">n_clusters</span>
-
-
-<span class="c1"># 2. Step (Optimization of n clusters)</span>
-<span class="k">def</span> <span class="nf">optimize_n_clusters</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">model</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">model_kwargs</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">n_clusters</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">min_th</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span> <span class="n">on_center</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Optimize the number of clusters using a recursive algorithm.</span>
-
-<span class="sd">    This function performs clustering in a recursive manner (through a while loop) to ensure</span>
-<span class="sd">    that the minimum within-cluster correlation is achieved for all clusters. It is an efficiency</span>
-<span class="sd">    optimized version of a step-wise algorithm where the `n_clusters` is incrementally increased</span>
-<span class="sd">    until a stop condition is met.</span>
-
-<span class="sd">    Parameters</span>
-<span class="sd">    ----------</span>
-<span class="sd">    X : array-like, shape (n_samples, n_features)</span>
-<span class="sd">        Feature matrix where `n_samples` is the number of samples and `n_features` is the number of features.</span>
-<span class="sd">    model : callable, optional</span>
-<span class="sd">        k-based clustering model to use.</span>
-<span class="sd">    model_kwargs : dict, optional</span>
-<span class="sd">        Dictionary of keyword arguments to pass to the clustering model.</span>
-<span class="sd">    n_clusters : int, optional</span>
-<span class="sd">        Estimated number of clusters (k).</span>
-<span class="sd">    min_th : float, optional, default = 0.5</span>
-<span class="sd">        Minimum threshold of within-cluster Pearson correlation required for a valid clustering.</span>
-<span class="sd">    on_center : bool, optional, default = True</span>
-<span class="sd">        Whether the minimum correlation is computed for all observations within a cluster</span>
-<span class="sd">        or just for the cluster center.</span>
-
-<span class="sd">    Returns</span>
-<span class="sd">    -------</span>
-<span class="sd">    n_clusters : int</span>
-<span class="sd">        Optimized number of clusters (k) after the recursive clustering.</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="n">n_samples</span><span class="p">,</span> <span class="n">n_features</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">shape</span>
-    <span class="n">f</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">c</span><span class="p">:</span> <span class="n">get_min_cor</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="n">model</span><span class="p">(</span><span class="n">n_clusters</span><span class="o">=</span><span class="n">c</span><span class="p">,</span> <span class="o">**</span><span class="n">model_kwargs</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">)</span><span class="o">.</span><span class="n">labels_</span><span class="p">,</span> <span class="n">on_center</span><span class="o">=</span><span class="n">on_center</span><span class="p">)</span>
-    <span class="n">min_cor</span> <span class="o">=</span> <span class="n">f</span><span class="p">(</span><span class="n">n_clusters</span><span class="p">)</span>
-    <span class="c1"># Recursive optimization of n_clusters via step wise increase starting from lower bound</span>
-    <span class="n">step</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="nb">min</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">n_samples</span><span class="o">/</span><span class="mi">10</span><span class="p">),</span> <span class="mi">5</span><span class="p">))</span>    <span class="c1"># Step size between 1 and 5</span>
-    <span class="k">while</span> <span class="n">min_cor</span> <span class="o">&lt;</span> <span class="n">min_th</span> <span class="ow">and</span> <span class="n">n_clusters</span> <span class="o">&lt;</span> <span class="n">n_samples</span><span class="p">:</span>    <span class="c1"># Stop condition of clustering</span>
-        <span class="n">n_clusters</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">n_clusters</span><span class="o">+</span><span class="n">step</span><span class="p">,</span> <span class="n">n_samples</span><span class="p">)</span> <span class="c1"># Maximum of of n_samples is allowed</span>
-        <span class="n">min_cor</span> <span class="o">=</span> <span class="n">f</span><span class="p">(</span><span class="n">n_clusters</span><span class="p">)</span>
-        <span class="c1"># Exceeding of threshold -&gt; Conservative adjustment of clustering parameters to meet true optimum</span>
-        <span class="k">if</span> <span class="n">min_cor</span> <span class="o">&gt;=</span> <span class="n">min_th</span> <span class="ow">and</span> <span class="n">step</span> <span class="o">!=</span> <span class="mi">1</span><span class="p">:</span>
-            <span class="n">n_clusters</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n_clusters</span> <span class="o">-</span> <span class="n">step</span> <span class="o">*</span> <span class="mi">2</span><span class="p">)</span>
-            <span class="n">step</span> <span class="o">=</span> <span class="mi">1</span>
-            <span class="n">min_cor</span> <span class="o">=</span> <span class="n">f</span><span class="p">(</span><span class="n">n_clusters</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">n_clusters</span>
-
-
-<span class="c1"># 3. Step (Merging)</span>
-<span class="k">def</span> <span class="nf">_get_min_cor_cluster</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">label_cluster</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">on_center</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Get min_cor for single cluster&quot;&quot;&quot;</span>
-    <span class="n">mask</span> <span class="o">=</span> <span class="p">[</span><span class="n">l</span> <span class="o">==</span> <span class="n">label_cluster</span> <span class="k">for</span> <span class="n">l</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">]</span>
-    <span class="n">min_cor</span> <span class="o">=</span> <span class="n">get_min_cor</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="n">mask</span><span class="p">],</span> <span class="n">on_center</span><span class="o">=</span><span class="n">on_center</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">min_cor</span>
-
-
-<span class="k">def</span> <span class="nf">_get_quality_measure</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">metric</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">label_cluster</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">on_center</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Get quality measure single cluster given by feature matrix X, labels, and label of cluster&quot;&quot;&quot;</span>
-    <span class="n">mask</span> <span class="o">=</span> <span class="p">[</span><span class="n">l</span> <span class="o">==</span> <span class="n">label_cluster</span> <span class="k">for</span> <span class="n">l</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">]</span>
-    <span class="k">if</span> <span class="n">metric</span> <span class="o">==</span> <span class="n">ut</span><span class="o">.</span><span class="n">METRIC_CORRELATION</span><span class="p">:</span>
-        <span class="k">return</span> <span class="n">get_min_cor</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="n">mask</span><span class="p">],</span> <span class="n">on_center</span><span class="o">=</span><span class="n">on_center</span><span class="p">)</span>
-    <span class="k">else</span><span class="p">:</span>
-        <span class="k">return</span> <span class="n">get_max_dist</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="n">mask</span><span class="p">],</span> <span class="n">on_center</span><span class="o">=</span><span class="n">on_center</span><span class="p">,</span> <span class="n">metric</span><span class="o">=</span><span class="n">metric</span><span class="p">)</span>
-
-
-<span class="k">def</span> <span class="nf">_get_best_cluster</span><span class="p">(</span><span class="n">dict_clust_qm</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">metric</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Get cluster with best quality measure: either highest minimum Pearson correlation</span>
-<span class="sd">    or lowest distance measure&quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="n">metric</span> <span class="o">==</span> <span class="n">ut</span><span class="o">.</span><span class="n">METRIC_CORRELATION</span><span class="p">:</span>
-        <span class="k">return</span> <span class="nb">max</span><span class="p">(</span><span class="n">dict_clust_qm</span><span class="p">,</span> <span class="n">key</span><span class="o">=</span><span class="n">dict_clust_qm</span><span class="o">.</span><span class="n">get</span><span class="p">)</span>
-    <span class="k">else</span><span class="p">:</span>
-        <span class="k">return</span> <span class="nb">min</span><span class="p">(</span><span class="n">dict_clust_qm</span><span class="p">,</span> <span class="n">key</span><span class="o">=</span><span class="n">dict_clust_qm</span><span class="o">.</span><span class="n">get</span><span class="p">)</span>
-
-
-<span class="k">def</span> <span class="nf">merge_clusters</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">n_max</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">min_th</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span> <span class="n">on_center</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">metric</span><span class="o">=</span><span class="s2">&quot;correlation&quot;</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Merge small clusters into other clusters optimizing a given quality measure.</span>
-
-<span class="sd">    This function merges clusters with sizes less than or equal to `n_max` into other clusters</span>
-<span class="sd">    based on a specified quality measure (Pearson correlation or a distance metric).</span>
-<span class="sd">    Merging is conducted only if the new assignment meets a minimum within-cluster Pearson</span>
-<span class="sd">    correlation threshold defined by `min_th`.</span>
-
-<span class="sd">    Parameters</span>
-<span class="sd">    ----------</span>
-<span class="sd">    X : array-like, shape (n_samples, n_features)</span>
-<span class="sd">        Feature matrix where `n_samples` is the number of samples and `n_features` is the number of features.</span>
-<span class="sd">    n_max : int, optional, default = 5</span>
-<span class="sd">        Maximum cluster size for small clusters to be considered for merging.</span>
-<span class="sd">    labels : array-like, shape (n_samples,), optional</span>
-<span class="sd">        Initial cluster labels for observations.</span>
-<span class="sd">    min_th : float, optional, default = 0.5</span>
-<span class="sd">        Minimum threshold of within-cluster Pearson correlation required for merging.</span>
-<span class="sd">    on_center : bool, optional, default = True</span>
-<span class="sd">        Whether the minimum correlation is computed for all observations within a cluster</span>
-<span class="sd">        or just for the cluster center.</span>
-<span class="sd">    metric : str, optional, default = &#39;correlation&#39;</span>
-<span class="sd">        Quality measure used to optimize merging. Can be &#39;correlation&#39; for maximum correlation</span>
-<span class="sd">        or any valid distance metric like &#39;euclidean&#39; for minimum distance.</span>
-
-<span class="sd">    Returns</span>
-<span class="sd">    -------</span>
-<span class="sd">    labels : array-like, shape (n_samples,)</span>
-<span class="sd">        Cluster labels for observations after merging.</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="n">unique_labels</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">OrderedDict</span><span class="o">.</span><span class="n">fromkeys</span><span class="p">(</span><span class="n">labels</span><span class="p">))</span>
-    <span class="k">for</span> <span class="n">n</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n_max</span><span class="p">):</span>
-        <span class="n">s_clusters</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">unique_labels</span> <span class="k">if</span> <span class="n">labels</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="o">==</span> <span class="n">n</span><span class="p">]</span>   <span class="c1"># Smallest clusters</span>
-        <span class="n">b_clusters</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">unique_labels</span> <span class="k">if</span> <span class="n">labels</span><span class="o">.</span><span class="n">count</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="o">&gt;</span> <span class="n">n</span><span class="p">]</span>    <span class="c1"># Bigger clusters (all others)</span>
-        <span class="c1"># Assign scales from smaller clusters to cluster by optimizing for quality measure</span>
-        <span class="k">for</span> <span class="n">s_clust</span> <span class="ow">in</span> <span class="n">s_clusters</span><span class="p">:</span>
-            <span class="n">dict_clust_qm</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># Cluster to quality measure</span>
-            <span class="k">for</span> <span class="n">b_clust</span> <span class="ow">in</span> <span class="n">b_clusters</span><span class="p">:</span>
-                <span class="n">labels_</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="n">s_clust</span> <span class="k">else</span> <span class="n">b_clust</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">]</span>
-                <span class="n">args</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">labels</span><span class="o">=</span><span class="n">labels_</span><span class="p">,</span> <span class="n">label_cluster</span><span class="o">=</span><span class="n">b_clust</span><span class="p">,</span> <span class="n">on_center</span><span class="o">=</span><span class="n">on_center</span><span class="p">)</span>
-                <span class="n">min_cor</span> <span class="o">=</span> <span class="n">_get_min_cor_cluster</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="o">**</span><span class="n">args</span><span class="p">)</span>
-                <span class="k">if</span> <span class="n">min_cor</span> <span class="o">&gt;=</span> <span class="n">min_th</span><span class="p">:</span>
-                    <span class="n">dict_clust_qm</span><span class="p">[</span><span class="n">b_clust</span><span class="p">]</span> <span class="o">=</span> <span class="n">_get_quality_measure</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="o">**</span><span class="n">args</span><span class="p">,</span> <span class="n">metric</span><span class="o">=</span><span class="n">metric</span><span class="p">)</span>
-            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">dict_clust_qm</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-                <span class="n">b_clust_best</span> <span class="o">=</span> <span class="n">_get_best_cluster</span><span class="p">(</span><span class="n">dict_clust_qm</span><span class="o">=</span><span class="n">dict_clust_qm</span><span class="p">,</span> <span class="n">metric</span><span class="o">=</span><span class="n">metric</span><span class="p">)</span>
-                <span class="n">labels</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="n">s_clust</span> <span class="k">else</span> <span class="n">b_clust_best</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">]</span>
-    <span class="c1"># Update labels (cluster labels are given in descending order of cluster size)</span>
-    <span class="n">sorted_labels</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">labels</span><span class="p">)</span><span class="o">.</span><span class="n">value_counts</span><span class="p">()</span><span class="o">.</span><span class="n">index</span>  <span class="c1"># sorted in descending order of size</span>
-    <span class="n">dict_update</span> <span class="o">=</span> <span class="p">{</span><span class="n">label</span><span class="p">:</span> <span class="n">i</span> <span class="k">for</span> <span class="n">label</span><span class="p">,</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">sorted_labels</span><span class="p">,</span> <span class="nb">range</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">labels</span><span class="p">))))}</span>
-    <span class="n">labels</span> <span class="o">=</span> <span class="p">[</span><span class="n">dict_update</span><span class="p">[</span><span class="n">label</span><span class="p">]</span> <span class="k">for</span> <span class="n">label</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">]</span>
-    <span class="k">return</span> <span class="n">labels</span>
-
-
-<span class="c1"># AAclust naming</span>
-<span class="k">def</span> <span class="nf">get_names_cluster</span><span class="p">(</span><span class="n">list_names</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">name_medoid</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">name_unclassified</span><span class="o">=</span><span class="s2">&quot;Unclassified&quot;</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Get list of cluster names sorted based on following criteria (descending order):</span>
-<span class="sd">        a) Frequency of term (most frequent term is preferred)</span>
-<span class="sd">        b) Term is the name or a sub-name of the given medoid</span>
-<span class="sd">        c) Length of term (shorter terms are preferred)</span>
-<span class="sd">    If cluster consists of only one term, the name will be &#39;unclassified (&#39;category name&#39;)&#39;</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="k">def</span> <span class="nf">remove_2nd_info</span><span class="p">(</span><span class="n">name_</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;Remove information given behind comma&quot;&quot;&quot;</span>
-        <span class="k">if</span> <span class="s2">&quot;,&quot;</span> <span class="ow">in</span> <span class="n">name_</span><span class="p">:</span>
-            <span class="n">name_</span> <span class="o">=</span> <span class="n">name_</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;,&quot;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-            <span class="k">if</span> <span class="s2">&quot;(&quot;</span> <span class="ow">in</span> <span class="n">name_</span><span class="p">:</span>
-                <span class="n">name_</span> <span class="o">+=</span> <span class="s2">&quot;)&quot;</span>  <span class="c1"># Close parenthesis if interpreted by deletion</span>
-        <span class="k">return</span> <span class="n">name_</span>
-    <span class="c1"># Filter categories (Remove unclassified scales and secondary infos)</span>
-    <span class="n">list_names</span> <span class="o">=</span> <span class="p">[</span><span class="n">remove_2nd_info</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">list_names</span> <span class="k">if</span> <span class="s2">&quot;Unclassified&quot;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">x</span><span class="p">]</span>
-    <span class="c1"># Create list of shorter names not containing information given in parenthesis</span>
-    <span class="n">list_short_names</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot; (&quot;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">list_names</span> <span class="k">if</span> <span class="s2">&quot; (&quot;</span> <span class="ow">in</span> <span class="n">x</span><span class="p">]</span>
-    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">list_names</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
-        <span class="n">list_names</span><span class="o">.</span><span class="n">extend</span><span class="p">(</span><span class="n">list_short_names</span><span class="p">)</span>
-        <span class="c1"># Obtain information to check criteria for sorting scale names</span>
-        <span class="n">df_counts</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">list_names</span><span class="p">)</span><span class="o">.</span><span class="n">value_counts</span><span class="p">()</span><span class="o">.</span><span class="n">to_frame</span><span class="p">()</span><span class="o">.</span><span class="n">reset_index</span><span class="p">()</span>   <span class="c1"># Compute frequencies of names</span>
-        <span class="n">df_counts</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;name&quot;</span><span class="p">,</span> <span class="s2">&quot;count&quot;</span><span class="p">]</span>
-        <span class="n">df_counts</span><span class="p">[</span><span class="s2">&quot;medoid&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="kc">True</span> <span class="k">if</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">name_medoid</span> <span class="k">else</span> <span class="kc">False</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">df_counts</span><span class="p">[</span><span class="s2">&quot;name&quot;</span><span class="p">]]</span>  <span class="c1"># Name in medoid</span>
-        <span class="n">df_counts</span><span class="p">[</span><span class="s2">&quot;length&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">df_counts</span><span class="p">[</span><span class="s2">&quot;name&quot;</span><span class="p">]]</span>      <span class="c1"># Length of name</span>
-        <span class="c1"># Sort names based on given criteria</span>
-        <span class="n">df_counts</span> <span class="o">=</span> <span class="n">df_counts</span><span class="o">.</span><span class="n">sort_values</span><span class="p">(</span><span class="n">by</span><span class="o">=</span><span class="p">[</span><span class="s2">&quot;count&quot;</span><span class="p">,</span> <span class="s2">&quot;medoid&quot;</span><span class="p">,</span> <span class="s2">&quot;length&quot;</span><span class="p">],</span> <span class="n">ascending</span><span class="o">=</span><span class="p">[</span><span class="kc">False</span><span class="p">,</span> <span class="kc">False</span><span class="p">,</span> <span class="kc">True</span><span class="p">])</span>
-        <span class="n">names_cluster</span> <span class="o">=</span> <span class="n">df_counts</span><span class="p">[</span><span class="s2">&quot;name&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-    <span class="k">else</span><span class="p">:</span>
-        <span class="n">names_cluster</span> <span class="o">=</span> <span class="p">[</span><span class="n">name_unclassified</span><span class="p">]</span>
-    <span class="k">return</span> <span class="n">names_cluster</span>
-
-
-<div class="viewcode-block" id="AAclust"><a class="viewcode-back" href="../../../generated/aaanalysis.AAclust.html#aaanalysis.AAclust">[docs]</a><span class="k">class</span> <span class="nc">AAclust</span><span class="p">:</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    AAclust: A k-optimized clustering framework for selecting redundancy-reduced set of numerical scales.</span>
-
-<span class="sd">    AAclust is designed primarily for amino acid scales but is versatile enough for any set of numerical indices.</span>
-<span class="sd">    It takes clustering models that require a pre-defined number of clusters (k) from</span>
-<span class="sd">    `scikit-learn &lt;https://scikit-learn.org/stable/modules/clustering.html&gt;`. By leveraging Pearson correlation as</span>
-<span class="sd">    similarity measure, AAclust optimizes the value of k. It then selects one representative sample (termed as &#39;medoid&#39;)</span>
-<span class="sd">    for each cluster, which is the closest to the cluster&#39;s center, yielding a redundancy-reduced sample set.</span>
-
-<span class="sd">    Parameters</span>
-<span class="sd">    ----------</span>
-<span class="sd">    model : callable, optional, default =  :class:`sklearn.cluster.KMeans`</span>
-<span class="sd">        The employed clustering model requiring pre-defined number of clusters &#39;k&#39;, given as &#39;n_clusters&#39; parameter.</span>
-<span class="sd">    model_kwargs : dict, optional, default = {}</span>
-<span class="sd">        A dictionary of keyword arguments to pass to the selected clustering model.</span>
-
-<span class="sd">    verbose : bool, optional, default = False</span>
-<span class="sd">        A flag to enable or disable verbose outputs.</span>
-
-<span class="sd">    Attributes</span>
-<span class="sd">    ----------</span>
-<span class="sd">    n_clusters : int, default = None</span>
-<span class="sd">        Number of clusters obtained by AAclust.</span>
-<span class="sd">    labels_ : array-like, default = None</span>
-<span class="sd">        Cluster labels in the order of samples in the feature matrix.</span>
-<span class="sd">    centers_ : array-like, default = None</span>
-<span class="sd">        Average scale values corresponding to each cluster.</span>
-<span class="sd">    center_labels_ : array-like, default = None</span>
-<span class="sd">        Cluster labels for each cluster center.</span>
-<span class="sd">    medoids_ : array-like, default = None</span>
-<span class="sd">        Representative samples (one for each cluster center).</span>
-<span class="sd">    medoid_labels_ : array-like, default = None</span>
-<span class="sd">        Cluster labels for each medoid.</span>
-<span class="sd">    medoid_ind_ : array-like, default = None</span>
-<span class="sd">        Indices of the chosen medoids within the original dataset.</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-<div class="viewcode-block" id="AAclust.__init__"><a class="viewcode-back" href="../../../generated/aaanalysis.AAclust.html#aaanalysis.AAclust.__init__">[docs]</a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">model</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">model_kwargs</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-        <span class="c1"># Model parameters</span>
-        <span class="k">if</span> <span class="n">model</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">model</span> <span class="o">=</span> <span class="n">KMeans</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">model</span> <span class="o">=</span> <span class="n">model</span>
-        <span class="k">if</span> <span class="n">model_kwargs</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">model_kwargs</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
-        <span class="n">model_kwargs</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_model</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="p">,</span> <span class="n">model_kwargs</span><span class="o">=</span><span class="n">model_kwargs</span><span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_model_kwargs</span> <span class="o">=</span> <span class="n">model_kwargs</span>
-        <span class="c1"># AAclust clustering settings</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_verbose</span> <span class="o">=</span> <span class="n">verbose</span>
-        <span class="c1"># Output parameters (will be set during model fitting)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">n_clusters</span> <span class="o">=</span> <span class="kc">None</span>  <span class="c1"># Number of by AAclust obtained clusters</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">labels_</span> <span class="o">=</span> <span class="kc">None</span>     <span class="c1"># Cluster labels in order of samples in feature matrix</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">centers_</span> <span class="o">=</span> <span class="kc">None</span>    <span class="c1"># Mean scales for each cluster</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">center_labels_</span> <span class="o">=</span> <span class="kc">None</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">medoids_</span> <span class="o">=</span> <span class="kc">None</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">medoid_labels_</span> <span class="o">=</span> <span class="kc">None</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">medoid_ind_</span> <span class="o">=</span> <span class="kc">None</span></div>
-
-    <span class="c1"># Clustering method</span>
-<div class="viewcode-block" id="AAclust.fit"><a class="viewcode-back" href="../../../generated/aaanalysis.AAclust.html#aaanalysis.AAclust.fit">[docs]</a>    <span class="k">def</span> <span class="nf">fit</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">names</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">on_center</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">min_th</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>  <span class="n">merge_metric</span><span class="o">=</span><span class="s2">&quot;euclidean&quot;</span><span class="p">,</span> <span class="n">n_clusters</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Fit the AAclust model on the data, optimizing cluster formation using Pearson correlation.</span>
-
-<span class="sd">        AAclust determines the optimal number of clusters, k, without pre-specification. It partitions data(X) into</span>
-<span class="sd">        clusters by maximizing the within-cluster Pearson correlation beyond the &#39;min_th&#39; threshold. The quality of</span>
-<span class="sd">        clustering is either based on the minimum Pearson correlation of all members (&#39;min_cor all&#39;) or between</span>
-<span class="sd">        the cluster center and its members (&#39;min_cor center&#39;), governed by `on_center`.</span>
-
-<span class="sd">        The clustering undergoes three stages:</span>
-<span class="sd">        1. Estimate the lower bound of k.</span>
-<span class="sd">        2. Refine k using the chosen quality metric.</span>
-<span class="sd">        3. Optionally merge smaller clusters, as directed by `merge_metric`.</span>
-
-<span class="sd">        Finally, a representative scale (medoid) &#39;closest to each cluster center is chosen for redundancy reduction.</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        X : array-like, shape (n_samples, n_features)</span>
-<span class="sd">            Feature matrix where `n_samples` is the number of samples and `n_features` is the number of features.</span>
-<span class="sd">        names : list of str, optional</span>
-<span class="sd">            Sample names. If provided, returns names of the medoids.</span>
-<span class="sd">        on_center : bool, default = True</span>
-<span class="sd">            If True, the correlation threshold is applied to the cluster center. Otherwise, it&#39;s applied to all cluster members.</span>
-<span class="sd">        min_th : float, default = 0</span>
-<span class="sd">            Pearson correlation threshold for clustering (between 0 and 1).</span>
-<span class="sd">        merge_metric : str or None, default = &quot;euclidean&quot;</span>
-<span class="sd">            Metric used for optional cluster merging. Can be &quot;euclidean&quot;, &quot;pearson&quot;, or None (no merging).</span>
-<span class="sd">        n_clusters : int, optional</span>
-<span class="sd">            Pre-defined number of clusters. If provided, AAclust uses this instead of optimizing k.</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        names_medoid : list of str, if `names` is provided</span>
-<span class="sd">            Names of the medoids.</span>
-
-<span class="sd">        Notes</span>
-<span class="sd">        -----</span>
-<span class="sd">        The &#39;fit&#39; method sets the following attributes: :attr: `aaanalysis.AAclust.n_clusters&quot;,</span>
-<span class="sd">        :attr: `aaanalysis.AAclust.labels_`, :attr: `aaanalysis.AAclust.centers_`,</span>
-<span class="sd">        :attr: `aaanalysis.AAclust.center_labels_`, :attr: `aaanalysis.AAclust.medoids_`.</span>
-<span class="sd">        :attr: `aaanalysis.AAclust.medoid_labels_`, :attr: `aaanalysis.AAclust.medoid_ind_`.</span>
-
-<span class="sd">        For further information, refer to the AAclust paper : TODO: add link to AAclust paper</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="c1"># Check input</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_min_th</span><span class="p">(</span><span class="n">min_th</span><span class="o">=</span><span class="n">min_th</span><span class="p">)</span>
-        <span class="n">merge_metric</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_merge_metric</span><span class="p">(</span><span class="n">merge_metric</span><span class="o">=</span><span class="n">merge_metric</span><span class="p">)</span>
-        <span class="n">X</span><span class="p">,</span> <span class="n">names</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_feat_matrix</span><span class="p">(</span><span class="n">X</span><span class="o">=</span><span class="n">X</span><span class="p">,</span> <span class="n">names</span><span class="o">=</span><span class="n">names</span><span class="p">)</span>
-        <span class="n">args</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="p">,</span> <span class="n">model_kwargs</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_model_kwargs</span><span class="p">,</span> <span class="n">min_th</span><span class="o">=</span><span class="n">min_th</span><span class="p">,</span> <span class="n">on_center</span><span class="o">=</span><span class="n">on_center</span><span class="p">)</span>
-        <span class="c1"># Clustering using given clustering models</span>
-        <span class="k">if</span> <span class="n">n_clusters</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">labels</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="p">(</span><span class="n">n_clusters</span><span class="o">=</span><span class="n">n_clusters</span><span class="p">,</span> <span class="o">**</span><span class="bp">self</span><span class="o">.</span><span class="n">_model_kwargs</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">)</span><span class="o">.</span><span class="n">labels_</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-        <span class="c1"># Clustering using AAclust algorithm</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="c1"># Estimation of lower bound of number of clusters via testing range between 10% and 90% of all scales</span>
-            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_verbose</span><span class="p">:</span>
-                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;1. Estimation of lower bound of k (number of clusters)&quot;</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s2">&quot;&quot;</span><span class="p">)</span>
-            <span class="n">n_clusters_lb</span> <span class="o">=</span> <span class="n">estimate_lower_bound_n_clusters</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="o">**</span><span class="n">args</span><span class="p">)</span>
-            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_verbose</span><span class="p">:</span>
-                <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;: k=</span><span class="si">{</span><span class="n">n_clusters_lb</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-            <span class="c1"># Optimization of number of clusters by recursive clustering</span>
-            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_verbose</span><span class="p">:</span>
-                <span class="n">objective_fct</span> <span class="o">=</span> <span class="s2">&quot;min_cor_center&quot;</span> <span class="k">if</span> <span class="n">on_center</span> <span class="k">else</span> <span class="s2">&quot;min_cor_all&quot;</span>
-                <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;2. Optimization of k by recursive clustering (</span><span class="si">{</span><span class="n">objective_fct</span><span class="si">}</span><span class="s2">, min_th=</span><span class="si">{</span><span class="n">min_th</span><span class="si">}</span><span class="s2">)&quot;</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s2">&quot;&quot;</span><span class="p">)</span>
-            <span class="n">n_clusters</span> <span class="o">=</span> <span class="n">optimize_n_clusters</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">n_clusters</span><span class="o">=</span><span class="n">n_clusters_lb</span><span class="p">,</span> <span class="o">**</span><span class="n">args</span><span class="p">)</span>
-            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_verbose</span><span class="p">:</span>
-                <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;: k=</span><span class="si">{</span><span class="n">n_clusters</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-            <span class="n">labels</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="p">(</span><span class="n">n_clusters</span><span class="o">=</span><span class="n">n_clusters</span><span class="p">,</span> <span class="o">**</span><span class="bp">self</span><span class="o">.</span><span class="n">_model_kwargs</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">)</span><span class="o">.</span><span class="n">labels_</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-            <span class="c1"># Cluster merging: assign scales from small clusters to other cluster with highest minimum correlation</span>
-            <span class="k">if</span> <span class="n">merge_metric</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_verbose</span><span class="p">:</span>
-                    <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;3. Cluster merging (optional)&quot;</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s2">&quot;&quot;</span><span class="p">)</span>
-                <span class="n">labels</span> <span class="o">=</span> <span class="n">merge_clusters</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="n">labels</span><span class="p">,</span> <span class="n">min_th</span><span class="o">=</span><span class="n">min_th</span><span class="p">,</span> <span class="n">on_center</span><span class="o">=</span><span class="n">on_center</span><span class="p">,</span> <span class="n">metric</span><span class="o">=</span><span class="n">merge_metric</span><span class="p">)</span>
-                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_verbose</span><span class="p">:</span>
-                    <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;: k=</span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">labels</span><span class="p">))</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-        <span class="c1"># Obtain cluster centers and medoids</span>
-        <span class="n">medoids</span><span class="p">,</span> <span class="n">medoid_labels</span><span class="p">,</span> <span class="n">medoid_ind</span> <span class="o">=</span> <span class="n">get_cluster_medoids</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="n">labels</span><span class="p">)</span>
-        <span class="n">centers</span><span class="p">,</span> <span class="n">center_labels</span> <span class="o">=</span> <span class="n">get_cluster_centers</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="n">labels</span><span class="p">)</span>
-        <span class="c1"># Save results</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">n_clusters</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">labels</span><span class="p">))</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">labels_</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">labels</span><span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">centers_</span> <span class="o">=</span> <span class="n">centers</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">center_labels_</span> <span class="o">=</span> <span class="n">center_labels</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">medoids_</span> <span class="o">=</span> <span class="n">medoids</span>     <span class="c1"># Representative scales</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">medoid_labels_</span> <span class="o">=</span> <span class="n">medoid_labels</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">medoid_ind_</span> <span class="o">=</span> <span class="n">medoid_ind</span>   <span class="c1"># Index of medoids</span>
-        <span class="c1"># Return labels of medoid if y is given</span>
-        <span class="k">if</span> <span class="n">names</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">names_medoid</span> <span class="o">=</span> <span class="p">[</span><span class="n">names</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">medoid_ind</span><span class="p">]</span>
-            <span class="k">return</span> <span class="n">names_medoid</span></div>
-
-<div class="viewcode-block" id="AAclust.cluster_naming"><a class="viewcode-back" href="../../../generated/aaanalysis.AAclust.html#aaanalysis.AAclust.cluster_naming">[docs]</a>    <span class="k">def</span> <span class="nf">cluster_naming</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">names</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">name_unclassified</span><span class="o">=</span><span class="s2">&quot;Unclassified&quot;</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Assigns names to clusters based on scale names and their frequency.</span>
-
-<span class="sd">        This method renames clusters based on the names of the scales in each cluster, with priority given to the</span>
-<span class="sd">        most frequent scales. If the name is already used or does not exist, it defaults to &#39;name_unclassified&#39;.</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        names : list, optional</span>
-<span class="sd">            List of scale names corresponding to each sample.</span>
-<span class="sd">        labels : list, optional</span>
-<span class="sd">            Cluster labels. If not provided, uses the labels from the fitted model.</span>
-<span class="sd">        name_unclassified : str, default = &quot;Unclassified&quot;</span>
-<span class="sd">            Name assigned to clusters that cannot be classified with the given names.</span>
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        cluster_names : list</span>
-<span class="sd">            A list of renamed clusters based on scale names.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">names</span><span class="p">)</span> <span class="ow">is</span> <span class="ow">not</span> <span class="nb">list</span><span class="p">:</span>
-            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;&#39;names&#39; must be list&quot;</span><span class="p">)</span>
-        <span class="k">if</span> <span class="n">labels</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">labels</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">labels_</span>
-        <span class="n">dict_medoids</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">medoid_labels_</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">medoid_ind_</span><span class="p">))</span>
-        <span class="c1"># Get cluster labels sorted in descending order of frequency</span>
-        <span class="n">labels_sorted</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">labels</span><span class="p">)</span><span class="o">.</span><span class="n">value_counts</span><span class="p">()</span><span class="o">.</span><span class="n">index</span>
-        <span class="c1"># Assign names to cluster</span>
-        <span class="n">dict_cluster_names</span> <span class="o">=</span> <span class="p">{}</span>
-        <span class="k">for</span> <span class="n">clust</span> <span class="ow">in</span> <span class="n">labels_sorted</span><span class="p">:</span>
-            <span class="n">name_medoid</span> <span class="o">=</span> <span class="n">names</span><span class="p">[</span><span class="n">dict_medoids</span><span class="p">[</span><span class="n">clust</span><span class="p">]]</span>
-            <span class="n">list_names</span> <span class="o">=</span> <span class="p">[</span><span class="n">names</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">names</span><span class="p">))</span> <span class="k">if</span> <span class="n">labels</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">==</span> <span class="n">clust</span><span class="p">]</span>
-            <span class="n">names_cluster</span> <span class="o">=</span> <span class="n">get_names_cluster</span><span class="p">(</span><span class="n">list_names</span><span class="o">=</span><span class="n">list_names</span><span class="p">,</span>
-                                              <span class="n">name_medoid</span><span class="o">=</span><span class="n">name_medoid</span><span class="p">,</span>
-                                              <span class="n">name_unclassified</span><span class="o">=</span><span class="n">name_unclassified</span><span class="p">)</span>
-            <span class="n">assigned</span> <span class="o">=</span> <span class="kc">False</span>
-            <span class="k">for</span> <span class="n">name</span> <span class="ow">in</span> <span class="n">names_cluster</span><span class="p">:</span>
-                <span class="k">if</span> <span class="n">name</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">dict_cluster_names</span><span class="o">.</span><span class="n">values</span><span class="p">()</span> <span class="ow">or</span> <span class="n">name</span> <span class="o">==</span> <span class="n">name_unclassified</span><span class="p">:</span>
-                    <span class="n">dict_cluster_names</span><span class="p">[</span><span class="n">clust</span><span class="p">]</span> <span class="o">=</span> <span class="n">name</span>
-                    <span class="n">assigned</span> <span class="o">=</span> <span class="kc">True</span>
-                    <span class="k">break</span>
-            <span class="k">if</span> <span class="ow">not</span> <span class="n">assigned</span><span class="p">:</span>
-                <span class="n">dict_cluster_names</span><span class="p">[</span><span class="n">clust</span><span class="p">]</span> <span class="o">=</span> <span class="n">name_unclassified</span>
-        <span class="n">cluster_names</span> <span class="o">=</span> <span class="p">[</span><span class="n">dict_cluster_names</span><span class="p">[</span><span class="n">label</span><span class="p">]</span> <span class="k">for</span> <span class="n">label</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">]</span>
-        <span class="k">return</span> <span class="n">cluster_names</span></div>
-
-<div class="viewcode-block" id="AAclust.get_cluster_centers"><a class="viewcode-back" href="../../../generated/aaanalysis.AAclust.html#aaanalysis.AAclust.get_cluster_centers">[docs]</a>    <span class="nd">@staticmethod</span>
-    <span class="k">def</span> <span class="nf">get_cluster_centers</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Computes the center of each cluster based on the given labels.</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        X : array-like, shape (n_samples, n_features)</span>
-<span class="sd">            Feature matrix where `n_samples` is the number of samples and `n_features` is the number of features.</span>
-<span class="sd">        labels : list or array-like, optional</span>
-<span class="sd">            Cluster labels for each sample in X.</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        centers : array-like</span>
-<span class="sd">            The computed center for each cluster.</span>
-<span class="sd">        center_labels : array-like</span>
-<span class="sd">            The labels associated with each computed center.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="n">centers</span><span class="p">,</span> <span class="n">center_labels</span> <span class="o">=</span> <span class="n">get_cluster_centers</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="n">labels</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">centers</span><span class="p">,</span> <span class="n">center_labels</span></div>
-
-<div class="viewcode-block" id="AAclust.get_cluster_medoids"><a class="viewcode-back" href="../../../generated/aaanalysis.AAclust.html#aaanalysis.AAclust.get_cluster_medoids">[docs]</a>    <span class="nd">@staticmethod</span>
-    <span class="k">def</span> <span class="nf">get_cluster_medoids</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Computes the medoid of each cluster based on the given labels.</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">         X : array-like, shape (n_samples, n_features)</span>
-<span class="sd">            Feature matrix where `n_samples` is the number of samples and `n_features` is the number of features.</span>
-<span class="sd">        labels : list or array-like, optional</span>
-<span class="sd">            Cluster labels for each sample in X.</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        medoids : array-like</span>
-<span class="sd">            The medoid for each cluster.</span>
-<span class="sd">        medoid_labels : array-like</span>
-<span class="sd">            The labels corresponding to each medoid.</span>
-<span class="sd">        medoid_ind : array-like</span>
-<span class="sd">            Indexes of medoids within the original data.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="n">medoids</span><span class="p">,</span> <span class="n">medoid_labels</span><span class="p">,</span> <span class="n">medoid_ind</span> <span class="o">=</span> <span class="n">get_cluster_medoids</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="n">labels</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">medoids</span><span class="p">,</span> <span class="n">medoid_labels</span><span class="p">,</span> <span class="n">medoid_ind</span></div>
-
-<div class="viewcode-block" id="AAclust.correlation"><a class="viewcode-back" href="../../../generated/aaanalysis.AAclust.html#aaanalysis.AAclust.correlation">[docs]</a>    <span class="nd">@staticmethod</span>
-    <span class="k">def</span> <span class="nf">correlation</span><span class="p">(</span><span class="n">X_test</span><span class="p">,</span> <span class="n">X_ref</span><span class="p">,</span> <span class="n">labels_test</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">labels_ref</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">n</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">positive</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-                    <span class="n">on_center</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">except_unclassified</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Computes the correlation of test data with reference cluster centers.</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        X_test : array-like</span>
-<span class="sd">            Test feature matrix.</span>
-<span class="sd">        X_ref : array-like</span>
-<span class="sd">            Reference feature matrix.</span>
-<span class="sd">        labels_test : list or array-like, optional</span>
-<span class="sd">            Cluster labels for the test data.</span>
-<span class="sd">        labels_ref : list or array-like, optional</span>
-<span class="sd">            Cluster labels for the reference data.</span>
-<span class="sd">        n : int, default = 3</span>
-<span class="sd">            Number of top centers to consider based on correlation strength.</span>
-<span class="sd">        positive : bool, default = True</span>
-<span class="sd">            If True, considers positive correlations. Else, negative correlations.</span>
-<span class="sd">        on_center : bool, default = False</span>
-<span class="sd">            If True, correlation is computed with cluster centers. Otherwise, with all cluster members.</span>
-<span class="sd">        except_unclassified : bool, default = True</span>
-<span class="sd">            If True, excludes &#39;unclassified&#39; clusters from the reference list.</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        list_top_center_name_corr : list of str</span>
-<span class="sd">            Names and correlations of centers having strongest (positive/negative) correlation with test data samples.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="c1"># Check input</span>
-        <span class="n">X_test</span><span class="p">,</span> <span class="n">labels_test</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_feat_matrix</span><span class="p">(</span><span class="n">X</span><span class="o">=</span><span class="n">X_test</span><span class="p">,</span> <span class="n">names</span><span class="o">=</span><span class="n">labels_test</span><span class="p">)</span>
-        <span class="n">X_ref</span><span class="p">,</span> <span class="n">labels_ref</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_feat_matrix</span><span class="p">(</span><span class="n">X</span><span class="o">=</span><span class="n">X_ref</span><span class="p">,</span> <span class="n">names</span><span class="o">=</span><span class="n">labels_ref</span><span class="p">)</span>
-        <span class="k">if</span> <span class="n">except_unclassified</span><span class="p">:</span>
-            <span class="n">names_ref</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="nb">dict</span><span class="o">.</span><span class="n">fromkeys</span><span class="p">(</span><span class="n">labels_ref</span><span class="p">))</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="n">names_ref</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">list</span><span class="p">(</span><span class="nb">dict</span><span class="o">.</span><span class="n">fromkeys</span><span class="p">(</span><span class="n">labels_ref</span><span class="p">))</span> <span class="k">if</span> <span class="s2">&quot;unclassified&quot;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">x</span><span class="o">.</span><span class="n">lower</span><span class="p">()]</span>
-        <span class="n">masks_ref</span> <span class="o">=</span> <span class="p">[[</span><span class="kc">True</span> <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="n">label</span> <span class="k">else</span> <span class="kc">False</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">labels_ref</span><span class="p">]</span> <span class="k">for</span> <span class="n">label</span> <span class="ow">in</span> <span class="n">names_ref</span><span class="p">]</span>
-        <span class="k">if</span> <span class="n">on_center</span><span class="p">:</span>
-            <span class="c1"># Get centers for all clusters in reference data</span>
-            <span class="n">centers</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">([</span><span class="n">cluster_center</span><span class="p">(</span><span class="n">X_ref</span><span class="p">[</span><span class="n">mask</span><span class="p">])</span> <span class="k">for</span> <span class="n">mask</span> <span class="ow">in</span> <span class="n">masks_ref</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-            <span class="c1"># Compute correlation of test data with centers</span>
-            <span class="n">Xtest_centers</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">([</span><span class="n">X_test</span><span class="p">,</span> <span class="n">centers</span><span class="p">],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-            <span class="n">n_test</span> <span class="o">=</span> <span class="n">X_test</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-            <span class="n">X_corr</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">corrcoef</span><span class="p">(</span><span class="n">Xtest_centers</span><span class="p">)[:</span><span class="n">n_test</span><span class="p">,</span> <span class="n">n_test</span><span class="p">:]</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="n">masks_test</span> <span class="o">=</span> <span class="p">[[</span><span class="kc">True</span> <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="n">j</span> <span class="k">else</span> <span class="kc">False</span> <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">labels_test</span><span class="p">))]</span>
-                          <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">labels_test</span><span class="p">)]</span>
-            <span class="c1"># Compute minimum correlation of test data with each group of reference data</span>
-            <span class="n">X_corr</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([[</span><span class="n">_min_cor_all</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">([</span><span class="n">X_test</span><span class="p">[</span><span class="n">mask_test</span><span class="p">],</span> <span class="n">X_ref</span><span class="p">[</span><span class="n">mask_ref</span><span class="p">]],</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">))</span>
-                                <span class="k">for</span> <span class="n">mask_ref</span> <span class="ow">in</span> <span class="n">masks_ref</span> <span class="p">]</span> <span class="k">for</span> <span class="n">mask_test</span> <span class="ow">in</span> <span class="n">masks_test</span><span class="p">])</span>
-        <span class="c1"># Get index for n centers with highest/lowest correlation for each scale</span>
-        <span class="k">if</span> <span class="n">positive</span><span class="p">:</span>
-            <span class="n">list_top_center_ind</span> <span class="o">=</span> <span class="n">X_corr</span><span class="o">.</span><span class="n">argsort</span><span class="p">()[:,</span> <span class="o">-</span><span class="n">n</span><span class="p">:][:,</span> <span class="p">::</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="n">list_top_center_ind</span> <span class="o">=</span> <span class="n">X_corr</span><span class="o">.</span><span class="n">argsort</span><span class="p">()[:,</span> <span class="p">:</span><span class="n">n</span><span class="p">]</span>
-        <span class="c1"># Get name and correlation for centers correlating strongest (positive/negative) with test data samples</span>
-        <span class="n">list_top_center_name_corr</span> <span class="o">=</span> <span class="p">[]</span>
-        <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">ind</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">list_top_center_ind</span><span class="p">):</span>
-            <span class="n">top_corr</span> <span class="o">=</span> <span class="n">X_corr</span><span class="p">[</span><span class="n">i</span><span class="p">,</span> <span class="p">:][</span><span class="n">ind</span><span class="p">]</span>
-            <span class="n">top_names</span> <span class="o">=</span> <span class="p">[</span><span class="n">names_ref</span><span class="p">[</span><span class="n">x</span><span class="p">]</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">ind</span><span class="p">]</span>
-            <span class="n">str_corr</span> <span class="o">=</span> <span class="s2">&quot;;&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">([</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> (</span><span class="si">{</span><span class="nb">round</span><span class="p">(</span><span class="n">corr</span><span class="p">,</span><span class="w"> </span><span class="mi">3</span><span class="p">)</span><span class="si">}</span><span class="s2">)&quot;</span> <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">corr</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">top_names</span><span class="p">,</span> <span class="n">top_corr</span><span class="p">)])</span>
-            <span class="n">list_top_center_name_corr</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">str_corr</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">list_top_center_name_corr</span></div>
-
-<div class="viewcode-block" id="AAclust.eval"><a class="viewcode-back" href="../../../generated/aaanalysis.AAclust.html#aaanalysis.AAclust.eval">[docs]</a>    <span class="k">def</span> <span class="nf">eval</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span></div></div>
-        <span class="c1"># TODO add evaluation function</span>
-</pre></div>
-
-           </div>
-          </div>
-          <footer>
-
-  <hr/>
-
-  <div role="contentinfo">
-    <p>&#169; Copyright 2023, Stephan Breimann.</p>
-  </div>
-
-   
-
-</footer>
-        </div>
-      </div>
-    </section>
-  </div>
-  <script>
-      jQuery(function () {
-          SphinxRtdTheme.Navigation.enable(true);
-      });
-  </script> 
-
-</body>
-</html>
\ No newline at end of file
diff --git a/docs/build/html/_modules/aaanalysis/cpp/cpp.html b/docs/build/html/_modules/aaanalysis/cpp/cpp.html
deleted file mode 100644
index 2aaced32..00000000
--- a/docs/build/html/_modules/aaanalysis/cpp/cpp.html
+++ /dev/null
@@ -1,443 +0,0 @@
-<!DOCTYPE html>
-<html class="writer-html5" lang="en" >
-<head>
-  <meta charset="utf-8" />
-  <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-  <title>aaanalysis.cpp.cpp &mdash; AAanalysis</title>
-      <link rel="stylesheet" href="../../../_static/pygments.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/css/theme.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/copybutton.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/plot_directive.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/css/style.css" type="text/css" />
-    <link rel="shortcut icon" href="../../../_static/logo_small.png"/>
-  <!--[if lt IE 9]>
-    <script src="../../../_static/js/html5shiv.min.js"></script>
-  <![endif]-->
-  
-        <script data-url_root="../../../" id="documentation_options" src="../../../_static/documentation_options.js"></script>
-        <script src="../../../_static/jquery.js"></script>
-        <script src="../../../_static/underscore.js"></script>
-        <script src="../../../_static/_sphinx_javascript_frameworks_compat.js"></script>
-        <script src="../../../_static/doctools.js"></script>
-        <script src="../../../_static/sphinx_highlight.js"></script>
-        <script src="../../../_static/clipboard.min.js"></script>
-        <script src="../../../_static/copybutton.js"></script>
-        <script src="../../../_static/design-tabs.js"></script>
-    <script src="../../../_static/js/theme.js"></script>
-    <link rel="index" title="Index" href="../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../search.html" /> 
-</head>
-
-<body class="wy-body-for-nav"> 
-  <div class="wy-grid-for-nav">
-    <nav data-toggle="wy-nav-shift" class="wy-nav-side">
-      <div class="wy-side-scroll">
-        <div class="wy-side-nav-search"  style="background: #343131" >
-            <a href="../../../index.html">
-            <img src="../../../_static/logo_big_trans.png" class="logo" alt="Logo"/>
-          </a>
-              <div class="version">
-                latest
-              </div>
-<div role="search">
-  <form id="rtd-search-form" class="wy-form" action="../../../search.html" method="get">
-    <input type="text" name="q" placeholder="Search docs" />
-    <input type="hidden" name="check_keywords" value="yes" />
-    <input type="hidden" name="area" value="default" />
-  </form>
-</div>
-        </div><div class="wy-menu wy-menu-vertical" data-spy="affix" role="navigation" aria-label="Navigation menu">
-              <p class="caption" role="heading"><span class="caption-text">OVERVIEW</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/introduction.html">Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/usage_principles.html">Usage Principles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/CONTRIBUTING_COPY.html">Contributing</a></li>
-</ul>
-<p class="caption" role="heading"><span class="caption-text">EXAMPLES</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../tutorials.html">Tutorials</a></li>
-</ul>
-<p class="caption" role="heading"><span class="caption-text">REFERENCES</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../api.html">API</a></li>
-</ul>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../_index/tables.html">Tables</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/references.html">References</a></li>
-</ul>
-
-        </div>
-      </div>
-    </nav>
-
-    <section data-toggle="wy-nav-shift" class="wy-nav-content-wrap"><nav class="wy-nav-top" aria-label="Mobile navigation menu"  style="background: #343131" >
-          <i data-toggle="wy-nav-top" class="fa fa-bars"></i>
-          <a href="../../../index.html">AAanalysis</a>
-      </nav>
-
-      <div class="wy-nav-content">
-        <div class="rst-content">
-          <div role="navigation" aria-label="Page navigation">
-  <ul class="wy-breadcrumbs">
-      <li><a href="../../../index.html" class="icon icon-home"></a></li>
-          <li class="breadcrumb-item"><a href="../../index.html">Module code</a></li>
-      <li class="breadcrumb-item active">aaanalysis.cpp.cpp</li>
-      <li class="wy-breadcrumbs-aside">
-      </li>
-  </ul>
-  <hr/>
-</div>
-          <div role="main" class="document" itemscope="itemscope" itemtype="http://schema.org/Article">
-           <div itemprop="articleBody">
-             
-  <h1>Source code for aaanalysis.cpp.cpp</h1><div class="highlight"><pre>
-<span></span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">This is a script for ...</span>
-<span class="sd">&quot;&quot;&quot;</span>
-<span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
-
-<span class="kn">from</span> <span class="nn">aaanalysis.cpp.feature</span> <span class="kn">import</span> <span class="n">SequenceFeature</span>
-<span class="kn">from</span> <span class="nn">aaanalysis.cpp._feature_stat</span> <span class="kn">import</span> <span class="n">SequenceFeatureStatistics</span>
-
-<span class="kn">import</span> <span class="nn">aaanalysis</span> <span class="k">as</span> <span class="nn">aa</span>
-<span class="kn">import</span> <span class="nn">aaanalysis.utils</span> <span class="k">as</span> <span class="nn">ut</span>
-<span class="kn">from</span> <span class="nn">aaanalysis.template_classes</span> <span class="kn">import</span> <span class="n">Tool</span>
-
-<span class="c1"># I Helper Functions</span>
-
-
-<span class="c1"># Filtering functions</span>
-<span class="k">def</span> <span class="nf">_filtering_info</span><span class="p">(</span><span class="n">df</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">df_scales</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">check_cat</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Get datasets structures for filtering, two dictionaries with feature to scales category resp.</span>
-<span class="sd">    feature positions and one datasets frame with paired pearson correlations of all scales&quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="n">check_cat</span><span class="p">:</span>
-        <span class="n">dict_c</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">df</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_FEATURE</span><span class="p">],</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;category&quot;</span><span class="p">]))</span>
-    <span class="k">else</span><span class="p">:</span>
-        <span class="n">dict_c</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
-    <span class="n">dict_p</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">df</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_FEATURE</span><span class="p">],</span> <span class="p">[</span><span class="nb">set</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="s2">&quot;positions&quot;</span><span class="p">]]))</span>
-    <span class="n">df_cor</span> <span class="o">=</span> <span class="n">df_scales</span><span class="o">.</span><span class="n">corr</span><span class="p">()</span>
-    <span class="k">return</span> <span class="n">dict_c</span><span class="p">,</span> <span class="n">dict_p</span><span class="p">,</span> <span class="n">df_cor</span>
-
-
-<span class="c1"># TODO simplify checks &amp; interface (end-to-end check with tests &amp; docu)</span>
-
-<span class="c1"># II Main Functions</span>
-<div class="viewcode-block" id="CPP"><a class="viewcode-back" href="../../../generated/aaanalysis.CPP.html#aaanalysis.CPP">[docs]</a><span class="k">class</span> <span class="nc">CPP</span><span class="p">(</span><span class="n">Tool</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Create and filter features that are most discriminant between two sets of sequences.</span>
-
-<span class="sd">    Parameters</span>
-<span class="sd">    ----------</span>
-<span class="sd">    df_scales : :class:`pandas.DataFrame`</span>
-<span class="sd">        DataFrame with amino acid scales.</span>
-<span class="sd">    df_cat : :class:`pandas.DataFrame`, default = aa.load_categories</span>
-<span class="sd">        DataFrame with default categories for physicochemical amino acid scales.</span>
-<span class="sd">    df_parts : :class:`pandas.DataFrame`</span>
-<span class="sd">        DataFrame with sequence parts.</span>
-<span class="sd">    split_kws : dict, default = SequenceFeature.get_split_kws</span>
-<span class="sd">        Nested dictionary with parameter dictionary for each chosen split_type.</span>
-<span class="sd">    accept_gaps : bool, default = False</span>
-<span class="sd">        Whether to accept missing values by enabling omitting for computations (if True).</span>
-
-<span class="sd">    verbose : bool, default = True</span>
-<span class="sd">        Whether to print progress information about the algorithm (if True).</span>
-
-<span class="sd">    Notes</span>
-<span class="sd">    -----</span>
-<span class="sd">    The CPP.run() method performs all steps of the CPP algorithm.</span>
-
-<span class="sd">    &quot;&quot;&quot;</span>
-<div class="viewcode-block" id="CPP.__init__"><a class="viewcode-back" href="../../../generated/aaanalysis.CPP.html#aaanalysis.CPP.__init__">[docs]</a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">df_scales</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">df_cat</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">df_parts</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">split_kws</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                 <span class="n">accept_gaps</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-        <span class="c1"># Load default scales if not specified</span>
-        <span class="n">sf</span> <span class="o">=</span> <span class="n">SequenceFeature</span><span class="p">()</span>
-        <span class="k">if</span> <span class="n">df_cat</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">df_cat</span> <span class="o">=</span> <span class="n">aa</span><span class="o">.</span><span class="n">load_scales</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="n">ut</span><span class="o">.</span><span class="n">STR_SCALE_CAT</span><span class="p">)</span>
-        <span class="k">if</span> <span class="n">df_scales</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">df_scales</span> <span class="o">=</span> <span class="n">aa</span><span class="o">.</span><span class="n">load_scales</span><span class="p">()</span>
-        <span class="k">if</span> <span class="n">split_kws</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">split_kws</span> <span class="o">=</span> <span class="n">sf</span><span class="o">.</span><span class="n">get_split_kws</span><span class="p">()</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_bool</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;verbose&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">verbose</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_df_parts</span><span class="p">(</span><span class="n">df_parts</span><span class="o">=</span><span class="n">df_parts</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="n">verbose</span><span class="p">)</span>
-        <span class="n">df_parts</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_df_scales</span><span class="p">(</span><span class="n">df_scales</span><span class="o">=</span><span class="n">df_scales</span><span class="p">,</span> <span class="n">df_parts</span><span class="o">=</span><span class="n">df_parts</span><span class="p">,</span> <span class="n">accept_gaps</span><span class="o">=</span><span class="n">accept_gaps</span><span class="p">)</span>
-        <span class="n">df_cat</span><span class="p">,</span> <span class="n">df_scales</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_df_cat</span><span class="p">(</span><span class="n">df_cat</span><span class="o">=</span><span class="n">df_cat</span><span class="p">,</span> <span class="n">df_scales</span><span class="o">=</span><span class="n">df_scales</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="n">verbose</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_split_kws</span><span class="p">(</span><span class="n">split_kws</span><span class="o">=</span><span class="n">split_kws</span><span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_verbose</span> <span class="o">=</span> <span class="n">verbose</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_accept_gaps</span> <span class="o">=</span> <span class="n">accept_gaps</span>
-        <span class="c1"># Feature components: Scales + Part + Split</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">df_cat</span> <span class="o">=</span> <span class="n">df_cat</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">df_scales</span> <span class="o">=</span> <span class="n">df_scales</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">df_parts</span> <span class="o">=</span> <span class="n">df_parts</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">split_kws</span> <span class="o">=</span> <span class="n">split_kws</span></div>
-
-    <span class="c1"># Adder methods for CPP analysis (used in run method)</span>
-    <span class="k">def</span> <span class="nf">_add_scale_info</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">df_feat</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Add scale information to DataFrame. Scale information are–from general to specific–scale categories,</span>
-<span class="sd">        sub categories, and scale names.</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        df_feat: :class:`pandas.DataFrame`</span>
-<span class="sd">            Feature DataFrame to add scale categories.</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        df_feat: :class:`pandas.DataFrame`</span>
-<span class="sd">            Feature DataFrame including scale categories.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="c1"># Check input</span>
-        <span class="n">df_feat</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_df_feat</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="n">df_feat</span><span class="p">)</span>
-
-        <span class="c1"># Add scale categories</span>
-        <span class="n">df_cat</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">df_cat</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-        <span class="n">i</span> <span class="o">=</span> <span class="n">df_feat</span><span class="o">.</span><span class="n">columns</span><span class="o">.</span><span class="n">get_loc</span><span class="p">(</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_FEATURE</span><span class="p">)</span>
-        <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SCALE_DES</span><span class="p">,</span> <span class="n">ut</span><span class="o">.</span><span class="n">COL_SCALE_NAME</span><span class="p">,</span> <span class="n">ut</span><span class="o">.</span><span class="n">COL_SUBCAT</span><span class="p">,</span> <span class="n">ut</span><span class="o">.</span><span class="n">COL_CAT</span><span class="p">]:</span>
-            <span class="k">if</span> <span class="n">col</span> <span class="ow">in</span> <span class="nb">list</span><span class="p">(</span><span class="n">df_feat</span><span class="p">):</span>
-                <span class="n">df_feat</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="n">col</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-            <span class="n">dict_cat</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">df_cat</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SCALE_ID</span><span class="p">],</span> <span class="n">df_cat</span><span class="p">[</span><span class="n">col</span><span class="p">]))</span>
-            <span class="n">vals</span> <span class="o">=</span> <span class="p">[</span><span class="n">dict_cat</span><span class="p">[</span><span class="n">s</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;-&quot;</span><span class="p">)[</span><span class="mi">2</span><span class="p">]]</span> <span class="k">for</span> <span class="n">s</span> <span class="ow">in</span> <span class="n">df_feat</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_FEATURE</span><span class="p">]]</span>
-            <span class="n">df_feat</span><span class="o">.</span><span class="n">insert</span><span class="p">(</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="n">col</span><span class="p">,</span> <span class="n">vals</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">df_feat</span>
-
-    <span class="k">def</span> <span class="nf">_add_stat</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">df_feat</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">parametric</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">accept_gaps</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Add summary statistics for each feature to DataFrame.</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        df_feat: :class:`pandas.DataFrame`</span>
-<span class="sd">            Feature DataFrame to add statistics.</span>
-<span class="sd">        labels: array-like, shape (n_samples)</span>
-<span class="sd">            Class labels for samples in df_parts attribute.</span>
-<span class="sd">        parametric: bool, default = False</span>
-<span class="sd">            Whether to use parametric (T-test) or non-parametric (U-test) test for p-value computation.</span>
-<span class="sd">        accept_gaps: bool, default = False</span>
-<span class="sd">            Whether to accept missing values by enabling omitting for computations (if True).</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        df_feat: :class:`pandas.DataFrame`</span>
-<span class="sd">            Feature DataFrame including statistics for comparing two given groups.</span>
-
-<span class="sd">        Notes</span>
-<span class="sd">        -----</span>
-<span class="sd">        P-values are calculated Mann-Whitney U test (non-parametric) or T-test (parametric) as implemented in SciPy.</span>
-
-<span class="sd">        For multiple hypothesis correction, the Benjamini-Hochberg FDR correction is applied on all given features</span>
-<span class="sd">        as implemented in SciPy.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="c1"># Check input</span>
-        <span class="n">df_feat</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_df_feat</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="n">df_feat</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_labels</span><span class="p">(</span><span class="n">labels</span><span class="o">=</span><span class="n">labels</span><span class="p">,</span> <span class="n">df</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">df_parts</span><span class="p">,</span> <span class="n">name_df</span><span class="o">=</span><span class="s2">&quot;df_parts&quot;</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_bool</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;parametric&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">parametric</span><span class="p">)</span>
-
-        <span class="c1"># Add feature statistics</span>
-        <span class="n">features</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">df_feat</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_FEATURE</span><span class="p">])</span>
-        <span class="n">sf</span> <span class="o">=</span> <span class="n">SequenceFeature</span><span class="p">()</span>
-        <span class="n">sfs</span> <span class="o">=</span> <span class="n">SequenceFeatureStatistics</span><span class="p">()</span>
-        <span class="n">X</span> <span class="o">=</span> <span class="n">sf</span><span class="o">.</span><span class="n">feat_matrix</span><span class="p">(</span><span class="n">df_parts</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">df_parts</span><span class="p">,</span>
-                           <span class="n">features</span><span class="o">=</span><span class="n">features</span><span class="p">,</span>
-                           <span class="n">df_scales</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">df_scales</span><span class="p">,</span>
-                           <span class="n">accept_gaps</span><span class="o">=</span><span class="n">accept_gaps</span><span class="p">)</span>
-        <span class="n">df_feat</span> <span class="o">=</span> <span class="n">sfs</span><span class="o">.</span><span class="n">add_stat</span><span class="p">(</span><span class="n">df</span><span class="o">=</span><span class="n">df_feat</span><span class="p">,</span> <span class="n">X</span><span class="o">=</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="o">=</span><span class="n">labels</span><span class="p">,</span> <span class="n">parametric</span><span class="o">=</span><span class="n">parametric</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">df_feat</span>
-
-    <span class="nd">@staticmethod</span>
-    <span class="k">def</span> <span class="nf">_add_positions</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">tmd_len</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span> <span class="n">jmd_n_len</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">ext_len</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;Add sequence positions to DataFrame.&quot;&quot;&quot;</span>
-        <span class="c1"># Check input (length checked by SequenceFeaturePositions)</span>
-        <span class="n">df_feat</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_df_feat</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="n">df_feat</span><span class="p">)</span>
-        <span class="c1"># Add positions of features</span>
-        <span class="n">features</span> <span class="o">=</span> <span class="n">df_feat</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_FEATURE</span><span class="p">]</span><span class="o">.</span><span class="n">to_list</span><span class="p">()</span>
-        <span class="n">sf</span> <span class="o">=</span> <span class="n">SequenceFeature</span><span class="p">()</span>
-        <span class="n">feat_positions</span> <span class="o">=</span> <span class="n">sf</span><span class="o">.</span><span class="n">add_position</span><span class="p">(</span><span class="n">features</span><span class="o">=</span><span class="n">features</span><span class="p">,</span> <span class="n">tmd_len</span><span class="o">=</span><span class="n">tmd_len</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="n">start</span><span class="p">,</span>
-                                         <span class="n">jmd_n_len</span><span class="o">=</span><span class="n">jmd_n_len</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="n">jmd_c_len</span><span class="p">,</span> <span class="n">ext_len</span><span class="o">=</span><span class="n">ext_len</span><span class="p">)</span>
-        <span class="n">df_feat</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_POSITION</span><span class="p">]</span> <span class="o">=</span> <span class="n">feat_positions</span>
-        <span class="k">return</span> <span class="n">df_feat</span>
-
-    <span class="c1"># Filtering methods</span>
-    <span class="nd">@staticmethod</span>
-    <span class="k">def</span> <span class="nf">_pre_filtering</span><span class="p">(</span><span class="n">features</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">abs_mean_dif</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">std_test</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">max_std_test</span><span class="o">=</span><span class="mf">0.2</span><span class="p">,</span> <span class="n">n</span><span class="o">=</span><span class="mi">10000</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;CPP pre-filtering based on thresholds.&quot;&quot;&quot;</span>
-        <span class="n">df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">features</span><span class="p">,</span> <span class="n">abs_mean_dif</span><span class="p">,</span> <span class="n">std_test</span><span class="p">),</span>
-                          <span class="n">columns</span><span class="o">=</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_FEATURE</span><span class="p">,</span> <span class="n">ut</span><span class="o">.</span><span class="n">COL_ABS_MEAN_DIF</span><span class="p">,</span> <span class="n">ut</span><span class="o">.</span><span class="n">COL_STD_TEST</span><span class="p">])</span>
-        <span class="n">df</span> <span class="o">=</span> <span class="n">df</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_STD_TEST</span><span class="p">]</span> <span class="o">&lt;=</span> <span class="n">max_std_test</span><span class="p">]</span>
-        <span class="n">df</span> <span class="o">=</span> <span class="n">df</span><span class="o">.</span><span class="n">sort_values</span><span class="p">(</span><span class="n">by</span><span class="o">=</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_ABS_MEAN_DIF</span><span class="p">,</span> <span class="n">ascending</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span><span class="o">.</span><span class="n">head</span><span class="p">(</span><span class="n">n</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">df</span>
-
-    <span class="k">def</span> <span class="nf">_filtering</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">df</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">max_overlap</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span> <span class="n">max_cor</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span> <span class="n">n_filter</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span> <span class="n">check_cat</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;CPP filtering algorithm based on redundancy reduction in descending order of absolute AUC.&quot;&quot;&quot;</span>
-        <span class="n">dict_c</span><span class="p">,</span> <span class="n">dict_p</span><span class="p">,</span> <span class="n">df_cor</span> <span class="o">=</span> <span class="n">_filtering_info</span><span class="p">(</span><span class="n">df</span><span class="o">=</span><span class="n">df</span><span class="p">,</span> <span class="n">df_scales</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">df_scales</span><span class="p">,</span> <span class="n">check_cat</span><span class="o">=</span><span class="n">check_cat</span><span class="p">)</span>
-        <span class="n">df</span> <span class="o">=</span> <span class="n">df</span><span class="o">.</span><span class="n">sort_values</span><span class="p">(</span><span class="n">by</span><span class="o">=</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_ABS_AUC</span><span class="p">,</span> <span class="n">ut</span><span class="o">.</span><span class="n">COL_ABS_MEAN_DIF</span><span class="p">],</span> <span class="n">ascending</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span><span class="o">.</span><span class="n">reset_index</span><span class="p">(</span><span class="n">drop</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-        <span class="n">list_feat</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">df</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_FEATURE</span><span class="p">])</span>
-        <span class="n">list_top_feat</span> <span class="o">=</span> <span class="p">[</span><span class="n">list_feat</span><span class="o">.</span><span class="n">pop</span><span class="p">(</span><span class="mi">0</span><span class="p">)]</span>  <span class="c1"># List with best feature</span>
-        <span class="k">for</span> <span class="n">feat</span> <span class="ow">in</span> <span class="n">list_feat</span><span class="p">:</span>
-            <span class="n">add_flag</span> <span class="o">=</span> <span class="kc">True</span>
-            <span class="c1"># Stop condition for limit</span>
-            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">list_top_feat</span><span class="p">)</span> <span class="o">==</span> <span class="n">n_filter</span><span class="p">:</span>
-                <span class="k">break</span>
-            <span class="c1"># Compare features with all top features (added if low overlap &amp; weak correlation or different category)</span>
-            <span class="k">for</span> <span class="n">top_feat</span> <span class="ow">in</span> <span class="n">list_top_feat</span><span class="p">:</span>
-                <span class="k">if</span> <span class="ow">not</span> <span class="n">check_cat</span> <span class="ow">or</span> <span class="n">dict_c</span><span class="p">[</span><span class="n">feat</span><span class="p">]</span> <span class="o">==</span> <span class="n">dict_c</span><span class="p">[</span><span class="n">top_feat</span><span class="p">]:</span>
-                    <span class="c1"># Remove if feat positions high overlap or subset</span>
-                    <span class="n">pos</span><span class="p">,</span> <span class="n">top_pos</span> <span class="o">=</span> <span class="n">dict_p</span><span class="p">[</span><span class="n">feat</span><span class="p">],</span> <span class="n">dict_p</span><span class="p">[</span><span class="n">top_feat</span><span class="p">]</span>
-                    <span class="n">overlap</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">top_pos</span><span class="o">.</span><span class="n">intersection</span><span class="p">(</span><span class="n">pos</span><span class="p">))</span><span class="o">/</span><span class="nb">len</span><span class="p">(</span><span class="n">top_pos</span><span class="o">.</span><span class="n">union</span><span class="p">(</span><span class="n">pos</span><span class="p">))</span>
-                    <span class="k">if</span> <span class="n">overlap</span> <span class="o">&gt;=</span> <span class="n">max_overlap</span> <span class="ow">or</span> <span class="n">pos</span><span class="o">.</span><span class="n">issubset</span><span class="p">(</span><span class="n">top_pos</span><span class="p">):</span>
-                        <span class="c1"># Remove if high pearson correlation</span>
-                        <span class="n">scale</span><span class="p">,</span> <span class="n">top_scale</span> <span class="o">=</span> <span class="n">feat</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;-&quot;</span><span class="p">)[</span><span class="mi">2</span><span class="p">],</span> <span class="n">top_feat</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;-&quot;</span><span class="p">)[</span><span class="mi">2</span><span class="p">]</span>
-                        <span class="n">cor</span> <span class="o">=</span> <span class="n">df_cor</span><span class="p">[</span><span class="n">top_scale</span><span class="p">][</span><span class="n">scale</span><span class="p">]</span>
-                        <span class="k">if</span> <span class="n">cor</span> <span class="o">&gt;</span> <span class="n">max_cor</span><span class="p">:</span>
-                            <span class="n">add_flag</span> <span class="o">=</span> <span class="kc">False</span>
-            <span class="k">if</span> <span class="n">add_flag</span><span class="p">:</span>
-                <span class="n">list_top_feat</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">feat</span><span class="p">)</span>
-        <span class="n">df_top_feat</span> <span class="o">=</span> <span class="n">df</span><span class="p">[</span><span class="n">df</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_FEATURE</span><span class="p">]</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">list_top_feat</span><span class="p">)]</span>
-        <span class="k">return</span> <span class="n">df_top_feat</span>
-
-    <span class="c1"># Main method</span>
-<div class="viewcode-block" id="CPP.run"><a class="viewcode-back" href="../../../generated/aaanalysis.CPP.html#aaanalysis.CPP.run">[docs]</a>    <span class="k">def</span> <span class="nf">run</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">parametric</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">n_filter</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span>
-            <span class="n">tmd_len</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span> <span class="n">jmd_n_len</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">ext_len</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-            <span class="n">check_cat</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">n_pre_filter</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">pct_pre_filter</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span> <span class="n">max_std_test</span><span class="o">=</span><span class="mf">0.2</span><span class="p">,</span> <span class="n">max_overlap</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span> <span class="n">max_cor</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span>
-            <span class="n">n_processes</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Perform CPP pipeline by creation and two-step filtering of features. CPP aims to</span>
-<span class="sd">        identify a collection of non-redundant features that are most discriminant between</span>
-<span class="sd">        a test and a reference group of sequences.</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        labels : array-like, shape (n_samples)</span>
-<span class="sd">            Class labels for samples in sequence DataFrame (test=1, reference=0).</span>
-<span class="sd">        parametric : bool, default = False</span>
-<span class="sd">            Whether to use parametric (T-test) or non-parametric (U-test) test for p-value computation.</span>
-<span class="sd">        n_filter : int, default = 100</span>
-<span class="sd">            Number of features to be filtered/selected by CPP algorithm.</span>
-<span class="sd">        n_pre_filter : int, optional</span>
-<span class="sd">            Number of feature to be pre-filtered by CPP algorithm. If None, a percentage of all features is used.</span>
-<span class="sd">        tmd_len : int, &gt;0</span>
-<span class="sd">            Length of TMD used for positions. TODO add link to explanation</span>
-<span class="sd">        start : int, &gt;=0</span>
-<span class="sd">            Position label of first amino acid position (starting at N-terminus).</span>
-<span class="sd">        jmd_n_len : int, &gt;=0, default = 10</span>
-<span class="sd">            Length of JMD-N.</span>
-<span class="sd">        jmd_c_len : int, &gt;=0, default = 10</span>
-<span class="sd">            Length of JMD-C.</span>
-<span class="sd">        ext_len : int, &gt;=0, default = 4</span>
-<span class="sd">            Length of TMD-extending part (starting from C and N terminal part of TMD).</span>
-<span class="sd">            Should be longer than jmd_n_len and jmd_c_len</span>
-<span class="sd">        check_cat : bool, default = True</span>
-<span class="sd">            Whether to check for redundancy within scale categories.</span>
-<span class="sd">        pct_pre_filter : int, default = 5</span>
-<span class="sd">            Percentage of all features that should remain after the pre-filtering step.</span>
-<span class="sd">        max_std_test : float [0-1], default = 0.2</span>
-<span class="sd">            Maximum standard deviation within the test group used as threshold for pre-filtering.</span>
-<span class="sd">        max_overlap : float [0-1], default = 0.5</span>
-<span class="sd">            Maximum positional overlap of features used as threshold for filtering.</span>
-<span class="sd">        max_cor : float [0-1], default = 0.5</span>
-<span class="sd">            Maximum Pearson correlation of features used as threshold for filtering.</span>
-<span class="sd">        n_processes : int, default = None</span>
-<span class="sd">            Number of CPUs used for multiprocessing. If None, number will be optimized automatically.</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        df_feat : :class:`pandas.DataFrame`, shape (n_feature, n_feature_information)</span>
-<span class="sd">            DataFrame with a unique identifier, scale information, statistics, and positions for each feature.</span>
-
-<span class="sd">        Notes</span>
-<span class="sd">        -----</span>
-<span class="sd">        The feature DataFrame contains the following eleven columns, including the unique</span>
-<span class="sd">        feature id (1), scale information (2-4), statistical results used for filtering and</span>
-<span class="sd">        ranking (5-10), and feature positions (11):</span>
-
-<span class="sd">        1. features: Feature ID (PART-SPLIT-SCALE)</span>
-<span class="sd">        2. category: Scale category</span>
-<span class="sd">        3. subcategory: Sub category of scales</span>
-<span class="sd">        4. scale_name: Name of scales</span>
-<span class="sd">        5. abs_auc: Absolute adjusted AUC [-0.5 to 0.5]</span>
-<span class="sd">        6. abs_mean_dif: Absolute mean differences between test and reference group [0 to 1]</span>
-<span class="sd">        7. std_test: Standard deviation in test group</span>
-<span class="sd">        8. std_ref: Standard deviation in reference group</span>
-<span class="sd">        9. p_val: Non-parametric (mann_whitney) or parametric (ttest_indep) statistic</span>
-<span class="sd">        10. p_val_fdr_bh: Benjamini-Hochberg FDR corrected p-values</span>
-<span class="sd">        11. positions: Feature positions for default settings</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="c1"># Check input</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_labels</span><span class="p">(</span><span class="n">labels</span><span class="o">=</span><span class="n">labels</span><span class="p">,</span> <span class="n">df</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">df_parts</span><span class="p">,</span> <span class="n">name_df</span><span class="o">=</span><span class="s2">&quot;df_parts&quot;</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_args_len</span><span class="p">(</span><span class="n">tmd_len</span><span class="o">=</span><span class="n">tmd_len</span><span class="p">,</span> <span class="n">jmd_n_len</span><span class="o">=</span><span class="n">jmd_n_len</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="n">jmd_c_len</span><span class="p">,</span> <span class="n">ext_len</span><span class="o">=</span><span class="n">ext_len</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;n_filter&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">n_filter</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;n_pre_filter&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">n_pre_filter</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;pct_pre_filter&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">pct_pre_filter</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span> <span class="n">max_val</span><span class="o">=</span><span class="mi">100</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;max_std_test&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">max_std_test</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mf">0.0</span><span class="p">,</span> <span class="n">max_val</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;max_overlap&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">max_overlap</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mf">0.0</span><span class="p">,</span> <span class="n">max_val</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_bool</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;verbose&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_verbose</span><span class="p">)</span>
-        <span class="c1"># Settings and creation of objects</span>
-        <span class="n">args</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">split_kws</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">split_kws</span><span class="p">,</span> <span class="n">df_scales</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">df_scales</span><span class="p">)</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_verbose</span><span class="p">:</span>
-            <span class="n">sf</span> <span class="o">=</span> <span class="n">SequenceFeature</span><span class="p">()</span>
-            <span class="n">n_feat</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">sf</span><span class="o">.</span><span class="n">get_features</span><span class="p">(</span><span class="o">**</span><span class="n">args</span><span class="p">,</span> <span class="n">list_parts</span><span class="o">=</span><span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">df_parts</span><span class="p">)))</span>
-            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;1. CPP creates </span><span class="si">{</span><span class="n">n_feat</span><span class="si">}</span><span class="s2"> features for </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">df_parts</span><span class="p">)</span><span class="si">}</span><span class="s2"> samples&quot;</span><span class="p">)</span>
-            <span class="n">ut</span><span class="o">.</span><span class="n">print_start_progress</span><span class="p">()</span>
-        <span class="c1"># Pre-filtering: Select best n % of feature (filter_pct) based std(test set) and mean_dif</span>
-        <span class="n">sfs</span> <span class="o">=</span> <span class="n">SequenceFeatureStatistics</span><span class="p">()</span>
-        <span class="n">abs_mean_dif</span><span class="p">,</span> <span class="n">std_test</span><span class="p">,</span> <span class="n">features</span> <span class="o">=</span> <span class="n">sfs</span><span class="o">.</span><span class="n">pre_filtering_info</span><span class="p">(</span><span class="o">**</span><span class="n">args</span><span class="p">,</span>
-                                                                  <span class="n">df_parts</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">df_parts</span><span class="p">,</span>
-                                                                  <span class="n">y</span><span class="o">=</span><span class="n">labels</span><span class="p">,</span>
-                                                                  <span class="n">accept_gaps</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_accept_gaps</span><span class="p">,</span>
-                                                                  <span class="n">verbose</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_verbose</span><span class="p">,</span>
-                                                                  <span class="n">n_processes</span><span class="o">=</span><span class="n">n_processes</span><span class="p">)</span>
-        <span class="k">if</span> <span class="n">n_pre_filter</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">n_pre_filter</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">features</span><span class="p">)</span> <span class="o">*</span> <span class="p">(</span><span class="n">pct_pre_filter</span> <span class="o">/</span> <span class="mi">100</span><span class="p">))</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_verbose</span><span class="p">:</span>
-            <span class="n">ut</span><span class="o">.</span><span class="n">print_finished_progress</span><span class="p">()</span>
-            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;2. CPP pre-filters </span><span class="si">{</span><span class="n">n_pre_filter</span><span class="si">}</span><span class="s2"> features (</span><span class="si">{</span><span class="n">pct_pre_filter</span><span class="si">}</span><span class="s2">%) with highest &#39;</span><span class="si">{</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_ABS_MEAN_DIF</span><span class="si">}</span><span class="s2">&#39;&quot;</span>
-                  <span class="sa">f</span><span class="s2">&quot; and &#39;max_std_test&#39; &lt;= </span><span class="si">{</span><span class="n">max_std_test</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-        <span class="n">df</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_pre_filtering</span><span class="p">(</span><span class="n">features</span><span class="o">=</span><span class="n">features</span><span class="p">,</span>
-                                 <span class="n">abs_mean_dif</span><span class="o">=</span><span class="n">abs_mean_dif</span><span class="p">,</span>
-                                 <span class="n">std_test</span><span class="o">=</span><span class="n">std_test</span><span class="p">,</span>
-                                 <span class="n">n</span><span class="o">=</span><span class="n">n_pre_filter</span><span class="p">,</span>
-                                 <span class="n">max_std_test</span><span class="o">=</span><span class="n">max_std_test</span><span class="p">)</span>
-        <span class="c1"># Filtering using CPP algorithm</span>
-        <span class="n">df</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_add_stat</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="n">df</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="n">labels</span><span class="p">,</span> <span class="n">parametric</span><span class="o">=</span><span class="n">parametric</span><span class="p">,</span> <span class="n">accept_gaps</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_accept_gaps</span><span class="p">)</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_verbose</span><span class="p">:</span>
-            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;3. CPP filtering algorithm&quot;</span><span class="p">)</span>
-        <span class="n">df</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_add_positions</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="n">df</span><span class="p">,</span> <span class="n">tmd_len</span><span class="o">=</span><span class="n">tmd_len</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="n">start</span><span class="p">)</span>
-        <span class="n">df</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_add_scale_info</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="n">df</span><span class="p">)</span>
-        <span class="n">df_feat</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_filtering</span><span class="p">(</span><span class="n">df</span><span class="o">=</span><span class="n">df</span><span class="p">,</span> <span class="n">n_filter</span><span class="o">=</span><span class="n">n_filter</span><span class="p">,</span> <span class="n">check_cat</span><span class="o">=</span><span class="n">check_cat</span><span class="p">,</span> <span class="n">max_overlap</span><span class="o">=</span><span class="n">max_overlap</span><span class="p">,</span> <span class="n">max_cor</span><span class="o">=</span><span class="n">max_cor</span><span class="p">)</span>
-        <span class="n">df_feat</span><span class="o">.</span><span class="n">reset_index</span><span class="p">(</span><span class="n">drop</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">inplace</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_verbose</span><span class="p">:</span>
-            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;4. CPP returns df with </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">df_feat</span><span class="p">)</span><span class="si">}</span><span class="s2"> unique features including general information and statistics&quot;</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">df_feat</span></div>
-
-<div class="viewcode-block" id="CPP.eval"><a class="viewcode-back" href="../../../generated/aaanalysis.CPP.html#aaanalysis.CPP.eval">[docs]</a>    <span class="nd">@staticmethod</span>
-    <span class="k">def</span> <span class="nf">eval</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">features</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;Get evaluation for provided dataset&quot;&quot;&quot;</span></div></div>
-        <span class="c1"># TODO get evaluation for any dataset for compelete</span>
-</pre></div>
-
-           </div>
-          </div>
-          <footer>
-
-  <hr/>
-
-  <div role="contentinfo">
-    <p>&#169; Copyright 2023, Stephan Breimann.</p>
-  </div>
-
-   
-
-</footer>
-        </div>
-      </div>
-    </section>
-  </div>
-  <script>
-      jQuery(function () {
-          SphinxRtdTheme.Navigation.enable(true);
-      });
-  </script> 
-
-</body>
-</html>
\ No newline at end of file
diff --git a/docs/build/html/_modules/aaanalysis/cpp/cpp_plot.html b/docs/build/html/_modules/aaanalysis/cpp/cpp_plot.html
deleted file mode 100644
index 5278f41c..00000000
--- a/docs/build/html/_modules/aaanalysis/cpp/cpp_plot.html
+++ /dev/null
@@ -1,777 +0,0 @@
-<!DOCTYPE html>
-<html class="writer-html5" lang="en" >
-<head>
-  <meta charset="utf-8" />
-  <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-  <title>aaanalysis.cpp.cpp_plot &mdash; AAanalysis</title>
-      <link rel="stylesheet" href="../../../_static/pygments.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/css/theme.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/copybutton.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/plot_directive.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/css/style.css" type="text/css" />
-    <link rel="shortcut icon" href="../../../_static/logo_small.png"/>
-  <!--[if lt IE 9]>
-    <script src="../../../_static/js/html5shiv.min.js"></script>
-  <![endif]-->
-  
-        <script data-url_root="../../../" id="documentation_options" src="../../../_static/documentation_options.js"></script>
-        <script src="../../../_static/jquery.js"></script>
-        <script src="../../../_static/underscore.js"></script>
-        <script src="../../../_static/_sphinx_javascript_frameworks_compat.js"></script>
-        <script src="../../../_static/doctools.js"></script>
-        <script src="../../../_static/sphinx_highlight.js"></script>
-        <script src="../../../_static/clipboard.min.js"></script>
-        <script src="../../../_static/copybutton.js"></script>
-        <script src="../../../_static/design-tabs.js"></script>
-    <script src="../../../_static/js/theme.js"></script>
-    <link rel="index" title="Index" href="../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../search.html" /> 
-</head>
-
-<body class="wy-body-for-nav"> 
-  <div class="wy-grid-for-nav">
-    <nav data-toggle="wy-nav-shift" class="wy-nav-side">
-      <div class="wy-side-scroll">
-        <div class="wy-side-nav-search"  style="background: #343131" >
-            <a href="../../../index.html">
-            <img src="../../../_static/logo_big_trans.png" class="logo" alt="Logo"/>
-          </a>
-              <div class="version">
-                latest
-              </div>
-<div role="search">
-  <form id="rtd-search-form" class="wy-form" action="../../../search.html" method="get">
-    <input type="text" name="q" placeholder="Search docs" />
-    <input type="hidden" name="check_keywords" value="yes" />
-    <input type="hidden" name="area" value="default" />
-  </form>
-</div>
-        </div><div class="wy-menu wy-menu-vertical" data-spy="affix" role="navigation" aria-label="Navigation menu">
-              <p class="caption" role="heading"><span class="caption-text">OVERVIEW</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/introduction.html">Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/usage_principles.html">Usage Principles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/CONTRIBUTING_COPY.html">Contributing</a></li>
-</ul>
-<p class="caption" role="heading"><span class="caption-text">EXAMPLES</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../tutorials.html">Tutorials</a></li>
-</ul>
-<p class="caption" role="heading"><span class="caption-text">REFERENCES</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../api.html">API</a></li>
-</ul>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../_index/tables.html">Tables</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/references.html">References</a></li>
-</ul>
-
-        </div>
-      </div>
-    </nav>
-
-    <section data-toggle="wy-nav-shift" class="wy-nav-content-wrap"><nav class="wy-nav-top" aria-label="Mobile navigation menu"  style="background: #343131" >
-          <i data-toggle="wy-nav-top" class="fa fa-bars"></i>
-          <a href="../../../index.html">AAanalysis</a>
-      </nav>
-
-      <div class="wy-nav-content">
-        <div class="rst-content">
-          <div role="navigation" aria-label="Page navigation">
-  <ul class="wy-breadcrumbs">
-      <li><a href="../../../index.html" class="icon icon-home"></a></li>
-          <li class="breadcrumb-item"><a href="../../index.html">Module code</a></li>
-      <li class="breadcrumb-item active">aaanalysis.cpp.cpp_plot</li>
-      <li class="wy-breadcrumbs-aside">
-      </li>
-  </ul>
-  <hr/>
-</div>
-          <div role="main" class="document" itemscope="itemscope" itemtype="http://schema.org/Article">
-           <div itemprop="articleBody">
-             
-  <h1>Source code for aaanalysis.cpp.cpp_plot</h1><div class="highlight"><pre>
-<span></span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">This is a script for ...</span>
-<span class="sd">&quot;&quot;&quot;</span>
-<span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
-<span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
-<span class="kn">import</span> <span class="nn">seaborn</span> <span class="k">as</span> <span class="nn">sns</span>
-<span class="kn">import</span> <span class="nn">inspect</span>
-
-<span class="kn">import</span> <span class="nn">aaanalysis</span>
-<span class="kn">from</span> <span class="nn">aaanalysis.cpp._cpp</span> <span class="kn">import</span> <span class="n">CPPPlots</span><span class="p">,</span> <span class="n">get_optimal_fontsize</span>
-
-<span class="kn">import</span> <span class="nn">aaanalysis.utils</span> <span class="k">as</span> <span class="nn">ut</span>
-
-<span class="c1"># Settings</span>
-<span class="n">pd</span><span class="o">.</span><span class="n">set_option</span><span class="p">(</span><span class="s1">&#39;expand_frame_repr&#39;</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>  <span class="c1"># Single line print for pd.Dataframe</span>
-
-<span class="c1"># TODO simplify checks &amp; interface (end-to-end check with tests &amp; docu)</span>
-<span class="c1"># TODO plot_functions test &amp; refactor (end-to-end)</span>
-
-
-<span class="c1"># I Helper Functions</span>
-<span class="k">def</span> <span class="nf">check_value_type</span><span class="p">(</span><span class="n">val_type</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">count_in</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check if value type is valid&quot;&quot;&quot;</span>
-    <span class="n">list_value_type</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="s2">&quot;sum&quot;</span><span class="p">,</span> <span class="s2">&quot;std&quot;</span><span class="p">]</span>
-    <span class="k">if</span> <span class="n">count_in</span><span class="p">:</span>
-        <span class="n">list_value_type</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="s2">&quot;count&quot;</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">val_type</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">list_value_type</span><span class="p">:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;&#39;val_type&#39; (&#39;</span><span class="si">{</span><span class="n">val_type</span><span class="si">}</span><span class="s2">&#39;) should be on of following: </span><span class="si">{</span><span class="n">list_value_type</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-
-
-<span class="k">def</span> <span class="nf">check_normalize</span><span class="p">(</span><span class="n">normalize</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check normalize parameter&quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="ow">not</span> <span class="p">(</span><span class="nb">type</span><span class="p">(</span><span class="n">normalize</span><span class="p">)</span> <span class="o">==</span> <span class="nb">bool</span> <span class="ow">or</span> <span class="n">normalize</span> <span class="ow">in</span> <span class="p">[</span><span class="s2">&quot;positions&quot;</span><span class="p">,</span> <span class="s2">&quot;positions_only&quot;</span><span class="p">]):</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;&#39;normalize&#39; (&#39;</span><span class="si">{</span><span class="n">normalize</span><span class="si">}</span><span class="s2">&#39;) should be bool or, if normalized for positions, &#39;positions&#39;.&quot;</span><span class="p">)</span>
-    <span class="n">normalize_for_positions</span> <span class="o">=</span> <span class="kc">False</span> <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">normalize</span><span class="p">)</span> <span class="ow">is</span> <span class="nb">bool</span> <span class="k">else</span> <span class="s2">&quot;positions&quot;</span> <span class="ow">in</span> <span class="n">normalize</span>
-    <span class="n">normalize</span> <span class="o">=</span> <span class="n">normalize</span> <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">normalize</span><span class="p">)</span> <span class="ow">is</span> <span class="nb">bool</span> <span class="k">else</span> <span class="s2">&quot;positions&quot;</span> <span class="o">==</span> <span class="n">normalize</span>
-    <span class="k">return</span> <span class="n">normalize</span><span class="p">,</span> <span class="n">normalize_for_positions</span>
-
-
-<span class="c1"># Check for plotting methods</span>
-<span class="k">def</span> <span class="nf">check_args_size</span><span class="p">(</span><span class="n">seq_size</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">tmd_jmd_fontsize</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check if sequence size parameters match&quot;&quot;&quot;</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;seq_size&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">seq_size</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;tmd_jmd_fontsize&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">tmd_jmd_fontsize</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-    <span class="n">args_size</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">seq_size</span><span class="o">=</span><span class="n">seq_size</span><span class="p">,</span> <span class="n">tmd_jmd_fontsize</span><span class="o">=</span><span class="n">tmd_jmd_fontsize</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">args_size</span>
-
-
-<span class="k">def</span> <span class="nf">check_args_xtick</span><span class="p">(</span><span class="n">xtick_size</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">xtick_width</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">xtick_length</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check if x tick parameters non-negative float&quot;&quot;&quot;</span>
-    <span class="n">args</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;xtick_size&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">xtick_size</span><span class="p">,</span> <span class="o">**</span><span class="n">args</span><span class="p">)</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;xtick_width&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">xtick_width</span><span class="p">,</span> <span class="o">**</span><span class="n">args</span><span class="p">)</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;xtick_length&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">xtick_length</span><span class="p">,</span> <span class="o">**</span><span class="n">args</span><span class="p">)</span>
-    <span class="n">args_xtick</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">xtick_size</span><span class="o">=</span><span class="n">xtick_size</span><span class="p">,</span> <span class="n">xtick_width</span><span class="o">=</span><span class="n">xtick_width</span><span class="p">,</span> <span class="n">xtick_length</span><span class="o">=</span><span class="n">xtick_length</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">args_xtick</span>
-
-
-<span class="k">def</span> <span class="nf">check_args_ytick</span><span class="p">(</span><span class="n">ytick_size</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">ytick_width</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">ytick_length</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check if y tick parameters non-negative float&quot;&quot;&quot;</span>
-    <span class="n">args</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;ytick_size&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">ytick_size</span><span class="p">,</span> <span class="o">**</span><span class="n">args</span><span class="p">)</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;ytick_width&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">ytick_width</span><span class="p">,</span> <span class="o">**</span><span class="n">args</span><span class="p">)</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;ytick_length&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">ytick_length</span><span class="p">,</span> <span class="o">**</span><span class="n">args</span><span class="p">)</span>
-    <span class="n">args_ytick</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">ytick_size</span><span class="o">=</span><span class="n">ytick_size</span><span class="p">,</span> <span class="n">ytick_width</span><span class="o">=</span><span class="n">ytick_width</span><span class="p">,</span> <span class="n">ytick_length</span><span class="o">=</span><span class="n">ytick_length</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">args_ytick</span>
-
-
-<span class="k">def</span> <span class="nf">check_part_color</span><span class="p">(</span><span class="n">tmd_color</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">jmd_color</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check if part colors valid&quot;&quot;&quot;</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_color</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;tmd_color&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">tmd_color</span><span class="p">)</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_color</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;jmd_color&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">jmd_color</span><span class="p">)</span>
-    <span class="n">args_part_color</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">tmd_color</span><span class="o">=</span><span class="n">tmd_color</span><span class="p">,</span> <span class="n">jmd_color</span><span class="o">=</span><span class="n">jmd_color</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">args_part_color</span>
-
-
-<span class="k">def</span> <span class="nf">check_seq_color</span><span class="p">(</span><span class="n">tmd_seq_color</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">jmd_seq_color</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check sequence colors&quot;&quot;&quot;</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_color</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;tmd_seq_color&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">tmd_seq_color</span><span class="p">)</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_color</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;jmd_seq_color&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">jmd_seq_color</span><span class="p">)</span>
-    <span class="n">args_seq_color</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">tmd_seq_color</span><span class="o">=</span><span class="n">tmd_seq_color</span><span class="p">,</span> <span class="n">jmd_seq_color</span><span class="o">=</span><span class="n">jmd_seq_color</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">args_seq_color</span>
-
-
-<span class="k">def</span> <span class="nf">check_figsize</span><span class="p">(</span><span class="n">figsize</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_tuple</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;figsize&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">figsize</span><span class="p">,</span> <span class="n">n</span><span class="o">=</span><span class="mi">2</span><span class="p">)</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;figsize:width&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">figsize</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;figsize:height&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">figsize</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-
-
-<span class="k">def</span> <span class="nf">check_dict_color</span><span class="p">(</span><span class="n">dict_color</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">df_cat</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check if color dictionary is matching to DataFrame with categories&quot;&quot;&quot;</span>
-    <span class="n">list_cats</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="nb">sorted</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">df_cat</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_CAT</span><span class="p">])))</span>
-    <span class="k">if</span> <span class="n">dict_color</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">dict_color</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">DICT_COLOR</span>
-    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">dict_color</span><span class="p">,</span> <span class="nb">dict</span><span class="p">):</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;&#39;dict_color&#39; should be a dictionary with colors for: </span><span class="si">{</span><span class="n">list_cats</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-    <span class="n">list_cat_not_in_dict_cat</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">list_cats</span> <span class="k">if</span> <span class="n">x</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">dict_color</span><span class="p">]</span>
-    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">list_cat_not_in_dict_cat</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-        <span class="n">error</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;&#39;dict_color&#39; not complete! Following categories are missing from &#39;df_cat&#39;: </span><span class="si">{</span><span class="n">list_cat_not_in_dict_cat</span><span class="si">}</span><span class="s2">&quot;</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">error</span><span class="p">)</span>
-    <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">dict_color</span><span class="p">:</span>
-        <span class="n">color</span> <span class="o">=</span> <span class="n">dict_color</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_color</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="n">key</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">color</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">dict_color</span>
-
-
-<span class="k">def</span> <span class="nf">check_parameters</span><span class="p">(</span><span class="n">func</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">name_called_func</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">e</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check parameters string from error message of third party packages&quot;&quot;&quot;</span>
-    <span class="n">list_arg_str</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;property &quot;</span><span class="p">,</span> <span class="s2">&quot;attribute &quot;</span><span class="p">,</span> <span class="s2">&quot;argument &quot;</span><span class="p">,</span> <span class="s2">&quot;parameter &quot;</span><span class="p">]</span>
-    <span class="n">str_error</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
-    <span class="k">for</span> <span class="n">arg_str</span> <span class="ow">in</span> <span class="n">list_arg_str</span><span class="p">:</span>
-        <span class="k">if</span> <span class="n">arg_str</span> <span class="ow">in</span> <span class="nb">str</span><span class="p">(</span><span class="n">e</span><span class="p">):</span>
-            <span class="n">error_arg</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">e</span><span class="p">)</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="n">arg_str</span><span class="p">)[</span><span class="mi">1</span><span class="p">]</span>
-            <span class="n">str_error</span> <span class="o">+=</span> <span class="s2">&quot;Error due to </span><span class="si">{}</span><span class="s2"> parameter. &quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">error_arg</span><span class="p">)</span>
-            <span class="k">break</span>
-    <span class="n">args</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">inspect</span><span class="o">.</span><span class="n">getfullargspec</span><span class="p">(</span><span class="n">func</span><span class="p">)</span><span class="o">.</span><span class="n">args</span> <span class="k">if</span> <span class="n">x</span> <span class="o">!=</span> <span class="s2">&quot;self&quot;</span><span class="p">]</span>
-    <span class="n">str_error</span> <span class="o">+=</span> <span class="s2">&quot;Arguments are allowed from </span><span class="si">{}</span><span class="s2"> and as follows: </span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">name_called_func</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">str_error</span>
-
-
-<span class="c1"># Check heatmap plotting</span>
-<span class="k">def</span> <span class="nf">check_vmin_vmax</span><span class="p">(</span><span class="n">vmin</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">vmax</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check if number of cmap colors is valid with given value range&quot;&quot;&quot;</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_float</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;vmin&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">vmin</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">just_float</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_float</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;vmax&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">vmax</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">just_float</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">vmin</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">vmax</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">vmin</span> <span class="o">&gt;=</span> <span class="n">vmax</span><span class="p">:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;&#39;vmin&#39; (</span><span class="si">{</span><span class="n">vmin</span><span class="si">}</span><span class="s2">) &lt; &#39;vmax&#39; (</span><span class="si">{</span><span class="n">vmax</span><span class="si">}</span><span class="s2">) not fulfilled.&quot;</span><span class="p">)</span>
-
-
-<span class="c1"># Check barplot and profile</span>
-<span class="k">def</span> <span class="nf">check_grid_axis</span><span class="p">(</span><span class="n">grid_axis</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span>
-    <span class="n">list_valid</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;x&quot;</span><span class="p">,</span> <span class="s1">&#39;y&#39;</span><span class="p">,</span> <span class="s1">&#39;both&#39;</span><span class="p">]</span>
-    <span class="k">if</span> <span class="n">grid_axis</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">list_valid</span><span class="p">:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;&#39;grid_axis&#39; (&#39;</span><span class="si">{</span><span class="n">grid_axis</span><span class="si">}</span><span class="s2">&#39;) not valid. Chose from following: </span><span class="si">{</span><span class="n">list_valid</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-
-
-<span class="c1"># Check stat plot</span>
-<span class="k">def</span> <span class="nf">check_ylabel_fontweight</span><span class="p">(</span><span class="n">ylabel_fontweight</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="n">accept_none</span> <span class="ow">and</span> <span class="n">ylabel_fontweight</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="k">return</span>
-    <span class="n">name</span> <span class="o">=</span> <span class="s2">&quot;ylabel_fontweight&quot;</span>
-    <span class="n">args</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">ylabel_fontweight</span><span class="p">)</span>
-    <span class="n">list_weights</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;light&#39;</span><span class="p">,</span> <span class="s1">&#39;medium&#39;</span><span class="p">,</span> <span class="s1">&#39;bold&#39;</span><span class="p">]</span>
-    <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">ylabel_fontweight</span><span class="p">)</span> <span class="ow">in</span> <span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">]:</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="o">**</span><span class="n">args</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">max_val</span><span class="o">=</span><span class="mi">1000</span><span class="p">,</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-    <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">ylabel_fontweight</span><span class="p">,</span> <span class="nb">str</span><span class="p">):</span>
-        <span class="k">if</span> <span class="n">ylabel_fontweight</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">list_weights</span><span class="p">:</span>
-            <span class="n">error</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;&#39;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">&#39; (</span><span class="si">{</span><span class="n">ylabel_fontweight</span><span class="si">}</span><span class="s2">) should be one of following: </span><span class="si">{</span><span class="n">list_weights</span><span class="si">}</span><span class="s2">&quot;</span>
-            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">error</span><span class="p">)</span>
-    <span class="k">else</span><span class="p">:</span>
-        <span class="n">error</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;&#39;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">&#39; (</span><span class="si">{</span><span class="n">ylabel_fontweight</span><span class="si">}</span><span class="s2">) should be either numeric value in range 0-1000&quot;</span> \
-                <span class="sa">f</span><span class="s2">&quot;</span><span class="se">\n\t</span><span class="s2">or one of following: </span><span class="si">{</span><span class="n">list_weights</span><span class="si">}</span><span class="s2">&quot;</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">error</span><span class="p">)</span>
-
-
-<span class="c1"># Plotting functions</span>
-<span class="k">def</span> <span class="nf">_get_df_pos</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">df_cat</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">y</span><span class="o">=</span><span class="s2">&quot;subcategory&quot;</span><span class="p">,</span> <span class="n">val_col</span><span class="o">=</span><span class="s2">&quot;mean_dif&quot;</span><span class="p">,</span>
-                <span class="n">value_type</span><span class="o">=</span><span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-                <span class="n">tmd_len</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span> <span class="n">jmd_n_len</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Helper method for plotting&quot;&quot;&quot;</span>
-    <span class="n">normalize</span><span class="p">,</span> <span class="n">normalize_for_pos</span> <span class="o">=</span> <span class="n">check_normalize</span><span class="p">(</span><span class="n">normalize</span><span class="o">=</span><span class="n">normalize</span><span class="p">)</span>
-    <span class="n">cpp_plot</span> <span class="o">=</span> <span class="n">CPPPlots</span><span class="p">(</span><span class="n">tmd_len</span><span class="o">=</span><span class="n">tmd_len</span><span class="p">,</span> <span class="n">jmd_n_len</span><span class="o">=</span><span class="n">jmd_n_len</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="n">jmd_c_len</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="n">start</span><span class="p">)</span>
-    <span class="n">df_pos</span> <span class="o">=</span> <span class="n">cpp_plot</span><span class="o">.</span><span class="n">get_df_pos</span><span class="p">(</span><span class="n">df</span><span class="o">=</span><span class="n">df_feat</span><span class="o">.</span><span class="n">copy</span><span class="p">(),</span> <span class="n">y</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">value_type</span><span class="o">=</span><span class="n">value_type</span><span class="p">,</span> <span class="n">val_col</span><span class="o">=</span><span class="n">val_col</span><span class="p">,</span>
-                                 <span class="n">normalize</span><span class="o">=</span><span class="n">normalize</span><span class="p">,</span>
-                                 <span class="n">normalize_for_pos</span><span class="o">=</span><span class="n">normalize_for_pos</span><span class="p">)</span>
-    <span class="c1"># Sort according to given categories</span>
-    <span class="n">list_cat</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">df_cat</span><span class="p">[</span><span class="n">y</span><span class="p">]</span><span class="o">.</span><span class="n">drop_duplicates</span><span class="p">())</span>
-    <span class="n">list_col</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">df_pos</span><span class="o">.</span><span class="n">T</span><span class="p">)</span>
-    <span class="n">sorted_col</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">list_cat</span> <span class="k">if</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">list_col</span><span class="p">]</span>
-    <span class="n">df_pos</span> <span class="o">=</span> <span class="n">df_pos</span><span class="o">.</span><span class="n">T</span><span class="p">[</span><span class="n">sorted_col</span><span class="p">]</span><span class="o">.</span><span class="n">T</span>
-    <span class="k">return</span> <span class="n">df_pos</span>
-
-
-<span class="k">def</span> <span class="nf">_add_importance_map</span><span class="p">(</span><span class="n">ax</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">df_feat</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">df_cat</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">args_len</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">y</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span>
-    <span class="n">_df_pos</span> <span class="o">=</span> <span class="n">_get_df_pos</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="n">df_feat</span><span class="p">,</span> <span class="n">df_cat</span><span class="o">=</span><span class="n">df_cat</span><span class="p">,</span> <span class="n">y</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">val_col</span><span class="o">=</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_FEAT_IMPORTANCE</span><span class="p">,</span>
-                          <span class="n">value_type</span><span class="o">=</span><span class="s2">&quot;sum&quot;</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="s2">&quot;positions_only&quot;</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="n">start</span><span class="p">,</span> <span class="o">**</span><span class="n">args_len</span><span class="p">)</span>
-    <span class="n">_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">melt</span><span class="p">(</span><span class="n">_df_pos</span><span class="o">.</span><span class="n">reset_index</span><span class="p">(),</span> <span class="n">id_vars</span><span class="o">=</span><span class="s2">&quot;index&quot;</span><span class="p">)</span>
-    <span class="n">_df</span><span class="o">.</span><span class="n">columns</span> <span class="o">=</span> <span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SUBCAT</span><span class="p">,</span> <span class="s2">&quot;position&quot;</span><span class="p">,</span> <span class="n">ut</span><span class="o">.</span><span class="n">COL_FEAT_IMPORTANCE</span><span class="p">]</span>
-    <span class="n">_list_sub_cat</span> <span class="o">=</span> <span class="n">_df</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SUBCAT</span><span class="p">]</span><span class="o">.</span><span class="n">unique</span><span class="p">()</span>
-    <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">sub_cat</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">_list_sub_cat</span><span class="p">):</span>
-        <span class="n">_dff</span> <span class="o">=</span> <span class="n">_df</span><span class="p">[</span><span class="n">_df</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SUBCAT</span><span class="p">]</span> <span class="o">==</span> <span class="n">sub_cat</span><span class="p">]</span>
-        <span class="k">for</span> <span class="n">pos</span><span class="p">,</span> <span class="n">val</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">_dff</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_FEAT_IMPORTANCE</span><span class="p">]):</span>
-            <span class="n">_symbol</span> <span class="o">=</span> <span class="s2">&quot;■&quot;</span>  <span class="c1"># &quot;•&quot;</span>
-            <span class="n">color</span> <span class="o">=</span> <span class="s2">&quot;black&quot;</span>
-            <span class="n">size</span> <span class="o">=</span> <span class="mi">12</span> <span class="k">if</span> <span class="n">val</span> <span class="o">&gt;=</span> <span class="mi">1</span> <span class="k">else</span> <span class="p">(</span><span class="mi">8</span> <span class="k">if</span> <span class="n">val</span> <span class="o">&gt;=</span> <span class="mf">0.5</span> <span class="k">else</span> <span class="mi">4</span><span class="p">)</span>
-            <span class="n">_args_symbol</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">ha</span><span class="o">=</span><span class="s2">&quot;center&quot;</span><span class="p">,</span> <span class="n">va</span><span class="o">=</span><span class="s2">&quot;center&quot;</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="n">color</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="n">size</span><span class="p">)</span>
-            <span class="k">if</span> <span class="n">val</span> <span class="o">&gt;=</span> <span class="mf">0.2</span><span class="p">:</span>
-                <span class="n">ax</span><span class="o">.</span><span class="n">text</span><span class="p">(</span><span class="n">pos</span> <span class="o">+</span> <span class="mf">0.5</span><span class="p">,</span> <span class="n">i</span> <span class="o">+</span> <span class="mf">0.5</span><span class="p">,</span> <span class="n">_symbol</span><span class="p">,</span> <span class="o">**</span><span class="n">_args_symbol</span><span class="p">)</span>
-
-
-<span class="k">def</span> <span class="nf">_set_size_to_optimized_value</span><span class="p">(</span><span class="n">seq_size</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">tmd_jmd_fontsize</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">opt_size</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Set sizes to given value if None&quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="n">tmd_jmd_fontsize</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">tmd_jmd_fontsize</span> <span class="o">=</span> <span class="n">opt_size</span>
-    <span class="n">args_size</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">seq_size</span><span class="o">=</span><span class="n">seq_size</span><span class="p">,</span> <span class="n">tmd_jmd_fontsize</span><span class="o">=</span><span class="n">tmd_jmd_fontsize</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">args_size</span>
-
-
-<span class="c1"># TODO simplify interface (delete old profile)</span>
-<span class="c1"># TODO add importance plot for heatmap</span>
-<span class="c1"># TODO add ranking</span>
-
-<span class="c1"># II Main Functions</span>
-<div class="viewcode-block" id="CPPPlot"><a class="viewcode-back" href="../../../generated/aaanalysis.CPPPlot.html#aaanalysis.CPPPlot">[docs]</a><span class="k">class</span> <span class="nc">CPPPlot</span><span class="p">:</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Create and filter features that are most discriminant between two sets of sequences.</span>
-
-<span class="sd">    Parameters</span>
-<span class="sd">    ----------</span>
-<span class="sd">    accept_gaps : bool, default = False</span>
-<span class="sd">        Whether to accept missing values by enabling omitting for computations (if True).</span>
-<span class="sd">    jmd_n_len : int, &gt;=0, default = 10</span>
-<span class="sd">        Length of JMD-N.</span>
-<span class="sd">    jmd_c_len : int, &gt;=0, default = 10</span>
-<span class="sd">        Length of JMD-C.</span>
-<span class="sd">    ext_len : int, &gt;=0, default = 4</span>
-<span class="sd">        Length of TMD-extending part (starting from C and N terminal part of TMD).</span>
-<span class="sd">        Conditions: ext_len &lt; jmd_m_len and ext_len &lt; jmd_c_len.</span>
-<span class="sd">    verbose : bool, default = True</span>
-<span class="sd">        Whether to print progress information about the algorithm (if True).</span>
-
-<span class="sd">    &quot;&quot;&quot;</span>
-<div class="viewcode-block" id="CPPPlot.__init__"><a class="viewcode-back" href="../../../generated/aaanalysis.CPPPlot.html#aaanalysis.CPPPlot.__init__">[docs]</a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">df_cat</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">accept_gaps</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">jmd_n_len</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">ext_len</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-        <span class="c1"># Load default scales if not specified</span>
-
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_bool</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;verbose&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">verbose</span><span class="p">)</span>
-        <span class="k">if</span> <span class="n">df_cat</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">df_cat</span> <span class="o">=</span> <span class="n">aaanalysis</span><span class="o">.</span><span class="n">load_scales</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SCALE_ID</span><span class="p">)</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">df_cat</span> <span class="o">=</span> <span class="n">df_cat</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_verbose</span> <span class="o">=</span> <span class="n">verbose</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_accept_gaps</span> <span class="o">=</span> <span class="n">accept_gaps</span>
-        <span class="c1"># Set consistent length of JMD_N, JMD_C, TMD flanking amino acids (TMD-E)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">jmd_n_len</span> <span class="o">=</span> <span class="n">jmd_n_len</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">jmd_c_len</span> <span class="o">=</span> <span class="n">jmd_c_len</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">ext_len</span> <span class="o">=</span> <span class="n">ext_len</span>
-        <span class="c1"># Axes dict for plotting</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">ax_seq</span> <span class="o">=</span> <span class="kc">None</span></div>
-
-    <span class="c1"># Plotting methods</span>
-<div class="viewcode-block" id="CPPPlot.profile"><a class="viewcode-back" href="../../../generated/aaanalysis.CPPPlot.html#aaanalysis.CPPPlot.profile">[docs]</a>    <span class="k">def</span> <span class="nf">profile</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">df_feat</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">y</span><span class="o">=</span><span class="s2">&quot;category&quot;</span><span class="p">,</span> <span class="n">val_col</span><span class="o">=</span><span class="s2">&quot;mean_dif&quot;</span><span class="p">,</span> <span class="n">val_type</span><span class="o">=</span><span class="s2">&quot;count&quot;</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-                <span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">7</span><span class="p">,</span> <span class="mi">5</span><span class="p">),</span> <span class="n">title</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">title_kws</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                <span class="n">dict_color</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">edge_color</span><span class="o">=</span><span class="s2">&quot;none&quot;</span><span class="p">,</span> <span class="n">bar_width</span><span class="o">=</span><span class="mf">0.75</span><span class="p">,</span>
-                <span class="n">add_jmd_tmd</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">tmd_len</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-                <span class="n">jmd_n_seq</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">tmd_seq</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">jmd_c_seq</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                <span class="n">tmd_color</span><span class="o">=</span><span class="s2">&quot;mediumspringgreen&quot;</span><span class="p">,</span> <span class="n">jmd_color</span><span class="o">=</span><span class="s2">&quot;blue&quot;</span><span class="p">,</span> <span class="n">tmd_seq_color</span><span class="o">=</span><span class="s2">&quot;black&quot;</span><span class="p">,</span> <span class="n">jmd_seq_color</span><span class="o">=</span><span class="s2">&quot;white&quot;</span><span class="p">,</span>
-                <span class="n">seq_size</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">tmd_jmd_fontsize</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                <span class="n">xtick_size</span><span class="o">=</span><span class="mf">11.0</span><span class="p">,</span> <span class="n">xtick_width</span><span class="o">=</span><span class="mf">2.0</span><span class="p">,</span> <span class="n">xtick_length</span><span class="o">=</span><span class="mf">5.0</span><span class="p">,</span> <span class="n">xticks_pos</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-                <span class="n">ytick_size</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">ytick_width</span><span class="o">=</span><span class="mf">2.0</span><span class="p">,</span> <span class="n">ytick_length</span><span class="o">=</span><span class="mf">5.0</span><span class="p">,</span> <span class="n">ylim</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                <span class="n">highlight_tmd_area</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">highlight_alpha</span><span class="o">=</span><span class="mf">0.15</span><span class="p">,</span>
-                <span class="n">grid</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">grid_axis</span><span class="o">=</span><span class="s2">&quot;both&quot;</span><span class="p">,</span>
-                <span class="n">add_legend_cat</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">legend_kws</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                <span class="n">shap_plot</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-                <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Plot feature profile for given features from &#39;df_feat&#39;.</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        df_feat : class:`pandas.DataFrame`, optional, default=None</span>
-<span class="sd">            Dataframe containing the features to be plotted. If None, default features from the instance will be used.</span>
-<span class="sd">        y : str, default=&#39;category&#39;</span>
-<span class="sd">            Column name in df_feat which contains the categories for grouping.</span>
-<span class="sd">        val_col : str, default=&#39;mean_dif&#39;</span>
-<span class="sd">            Column name in df_feat which contains the values to be plotted.</span>
-<span class="sd">        val_type : str, default=&#39;count&#39;</span>
-<span class="sd">            Type of value. Available options are specified by the `check_value_type` function.</span>
-<span class="sd">        normalize : bool, default=False</span>
-<span class="sd">            If True, the feature values will be normalized.</span>
-<span class="sd">        figsize : tuple, default=(7, 5)</span>
-<span class="sd">            Size of the plot.</span>
-<span class="sd">        title : str, optional</span>
-<span class="sd">            Title of the plot.</span>
-<span class="sd">        title_kws : dict, optional</span>
-<span class="sd">            Keyword arguments to customize the title appearance.</span>
-<span class="sd">        dict_color : dict, optional</span>
-<span class="sd">            Dictionary mapping categories to colors.</span>
-<span class="sd">        edge_color : str, default=&#39;none&#39;</span>
-<span class="sd">            Color of the edges of the bars.</span>
-<span class="sd">        bar_width : float, default=0.75</span>
-<span class="sd">            Width of the bars.</span>
-<span class="sd">        add_jmd_tmd : bool, default=True</span>
-<span class="sd">            If True, adds JMD and TMD lines/annotations to the plot.</span>
-<span class="sd">        tmd_len : int, default=20</span>
-<span class="sd">            Length of the TMD.</span>
-<span class="sd">        start : int, default=1</span>
-<span class="sd">            Start position.</span>
-<span class="sd">        jmd_n_seq : str, optional</span>
-<span class="sd">            JMD N-terminal sequence.</span>
-<span class="sd">        tmd_seq : str, optional</span>
-<span class="sd">            TMD sequence.</span>
-<span class="sd">        jmd_c_seq : str, optional</span>
-<span class="sd">            JMD C-terminal sequence.</span>
-<span class="sd">        tmd_color : str, default=&#39;mediumspringgreen&#39;</span>
-<span class="sd">            Color for TMD.</span>
-<span class="sd">        jmd_color : str, default=&#39;blue&#39;</span>
-<span class="sd">            Color for JMD.</span>
-<span class="sd">        tmd_seq_color : str, default=&#39;black&#39;</span>
-<span class="sd">            Color for TMD sequence.</span>
-<span class="sd">        jmd_seq_color : str, default=&#39;white&#39;</span>
-<span class="sd">            Color for JMD sequence.</span>
-<span class="sd">        seq_size : float, optional</span>
-<span class="sd">            Font size for sequence annotations.</span>
-<span class="sd">        tmd_jmd_fontsize : float, optional</span>
-<span class="sd">            Font size for TMD and JMD annotations.</span>
-<span class="sd">        xtick_size : float, default=11.0</span>
-<span class="sd">            Size for x-tick labels.</span>
-<span class="sd">        xtick_width : float, default=2.0</span>
-<span class="sd">            Width of the x-ticks.</span>
-<span class="sd">        xtick_length : float, default=5.0</span>
-<span class="sd">            Length of the x-ticks.</span>
-<span class="sd">        xticks_pos : bool, default=False</span>
-<span class="sd">            If True, x-tick positions are adjusted based on given sequences.</span>
-<span class="sd">        ytick_size : float, optional</span>
-<span class="sd">            Size for y-tick labels.</span>
-<span class="sd">        ytick_width : float, default=2.0</span>
-<span class="sd">            Width of the y-ticks.</span>
-<span class="sd">        ytick_length : float, default=5.0</span>
-<span class="sd">            Length of the y-ticks.</span>
-<span class="sd">        ylim : tuple, optional</span>
-<span class="sd">            Y-axis limits.</span>
-<span class="sd">        highlight_tmd_area : bool, default=True</span>
-<span class="sd">            If True, highlights the TMD area on the plot.</span>
-<span class="sd">        highlight_alpha : float, default=0.15</span>
-<span class="sd">            Alpha value for TMD area highlighting.</span>
-<span class="sd">        grid : bool, default=False</span>
-<span class="sd">            If True, a grid is added to the plot.</span>
-<span class="sd">        grid_axis : str, default=&#39;both&#39;</span>
-<span class="sd">            Axis on which the grid is drawn. Options: &#39;both&#39;, &#39;x&#39;, &#39;y&#39;.</span>
-<span class="sd">        add_legend_cat : bool, default=True</span>
-<span class="sd">            If True, a legend is added for categories.</span>
-<span class="sd">        legend_kws : dict, optional</span>
-<span class="sd">            Keyword arguments for the legend.</span>
-<span class="sd">        shap_plot : bool, default=False</span>
-<span class="sd">            If True, SHAP (SHapley Additive exPlanations) plot is generated.</span>
-<span class="sd">        **kwargs : dict</span>
-<span class="sd">            Other keyword arguments passed to internal functions or plotting libraries.</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        ax : matplotlib.axes.Axes</span>
-<span class="sd">            The axes object containing the plot.</span>
-
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="c1"># Group arguments</span>
-        <span class="n">args_seq</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">jmd_n_seq</span><span class="o">=</span><span class="n">jmd_n_seq</span><span class="p">,</span> <span class="n">tmd_seq</span><span class="o">=</span><span class="n">tmd_seq</span><span class="p">,</span> <span class="n">jmd_c_seq</span><span class="o">=</span><span class="n">jmd_c_seq</span><span class="p">,)</span>
-        <span class="n">args_size</span> <span class="o">=</span> <span class="n">check_args_size</span><span class="p">(</span><span class="n">seq_size</span><span class="o">=</span><span class="n">seq_size</span><span class="p">,</span> <span class="n">tmd_jmd_fontsize</span><span class="o">=</span><span class="n">tmd_jmd_fontsize</span><span class="p">)</span>
-        <span class="n">args_len</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_args_len</span><span class="p">(</span><span class="n">tmd_len</span><span class="o">=</span><span class="n">tmd_len</span><span class="p">,</span> <span class="n">jmd_n_len</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">jmd_n_len</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">jmd_c_len</span><span class="p">,</span> <span class="o">**</span><span class="n">args_seq</span><span class="p">)</span>
-        <span class="n">args_xtick</span> <span class="o">=</span> <span class="n">check_args_xtick</span><span class="p">(</span><span class="n">xtick_size</span><span class="o">=</span><span class="n">xtick_size</span><span class="p">,</span> <span class="n">xtick_width</span><span class="o">=</span><span class="n">xtick_width</span><span class="p">,</span> <span class="n">xtick_length</span><span class="o">=</span><span class="n">xtick_length</span><span class="p">)</span>
-        <span class="n">args_part_color</span> <span class="o">=</span> <span class="n">check_part_color</span><span class="p">(</span><span class="n">tmd_color</span><span class="o">=</span><span class="n">tmd_color</span><span class="p">,</span> <span class="n">jmd_color</span><span class="o">=</span><span class="n">jmd_color</span><span class="p">)</span>
-        <span class="n">args_seq_color</span> <span class="o">=</span> <span class="n">check_seq_color</span><span class="p">(</span><span class="n">tmd_seq_color</span><span class="o">=</span><span class="n">tmd_seq_color</span><span class="p">,</span> <span class="n">jmd_seq_color</span><span class="o">=</span><span class="n">jmd_seq_color</span><span class="p">)</span>
-
-        <span class="c1"># Checking input</span>
-        <span class="c1"># Args checked by Matplotlib: title, legend_kws</span>
-        <span class="c1"># Args checked by internal plotting functions: ylim</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;bar_width&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">bar_width</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;start&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">start</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;tmd_area_alpha&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">highlight_alpha</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">max_val</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_bool</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;add_jmd_tmd&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">add_jmd_tmd</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_bool</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;highlight_tmd_area&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">highlight_tmd_area</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_bool</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;grid&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">grid</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_bool</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;shap_plot&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">shap_plot</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_bool</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;add_legend_cat&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">add_legend_cat</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_color</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;edge_color&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">edge_color</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_dict</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;legend_kws&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">legend_kws</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_col_in_df</span><span class="p">(</span><span class="n">df</span><span class="o">=</span><span class="n">df_feat</span><span class="p">,</span> <span class="n">name_df</span><span class="o">=</span><span class="s2">&quot;df_feat&quot;</span><span class="p">,</span> <span class="n">col</span><span class="o">=</span><span class="n">val_col</span><span class="p">,</span> <span class="n">col_type</span><span class="o">=</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">])</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_y_categorical</span><span class="p">(</span><span class="n">df</span><span class="o">=</span><span class="n">df_feat</span><span class="p">,</span> <span class="n">y</span><span class="o">=</span><span class="n">y</span><span class="p">)</span>
-        <span class="n">df_feat</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_df_feat</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="n">df_feat</span><span class="p">)</span>
-        <span class="n">check_value_type</span><span class="p">(</span><span class="n">val_type</span><span class="o">=</span><span class="n">val_type</span><span class="p">,</span> <span class="n">count_in</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-        <span class="n">check_args_ytick</span><span class="p">(</span><span class="n">ytick_size</span><span class="o">=</span><span class="n">ytick_size</span><span class="p">,</span> <span class="n">ytick_width</span><span class="o">=</span><span class="n">ytick_width</span><span class="p">,</span> <span class="n">ytick_length</span><span class="o">=</span><span class="n">ytick_length</span><span class="p">)</span>
-        <span class="n">check_figsize</span><span class="p">(</span><span class="n">figsize</span><span class="o">=</span><span class="n">figsize</span><span class="p">)</span>
-        <span class="n">dict_color</span> <span class="o">=</span> <span class="n">check_dict_color</span><span class="p">(</span><span class="n">dict_color</span><span class="o">=</span><span class="n">dict_color</span><span class="p">,</span> <span class="n">df_cat</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">df_cat</span><span class="p">)</span>
-        <span class="n">check_grid_axis</span><span class="p">(</span><span class="n">grid_axis</span><span class="o">=</span><span class="n">grid_axis</span><span class="p">)</span>
-        <span class="c1"># Get df positions</span>
-        <span class="n">df_feat</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">add_positions</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="n">df_feat</span><span class="p">,</span> <span class="n">tmd_len</span><span class="o">=</span><span class="n">args_len</span><span class="p">[</span><span class="s2">&quot;tmd_len&quot;</span><span class="p">],</span> <span class="n">start</span><span class="o">=</span><span class="n">start</span><span class="p">)</span>
-        <span class="n">df_pos</span> <span class="o">=</span> <span class="n">_get_df_pos</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="n">df_feat</span><span class="p">,</span> <span class="n">df_cat</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">df_cat</span><span class="p">,</span> <span class="n">y</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">val_col</span><span class="o">=</span><span class="n">val_col</span><span class="p">,</span>
-                             <span class="n">value_type</span><span class="o">=</span><span class="n">val_type</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="n">normalize</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="n">start</span><span class="p">,</span> <span class="o">**</span><span class="n">args_len</span><span class="p">)</span>
-        <span class="c1"># Plotting</span>
-        <span class="n">cpp_plot</span> <span class="o">=</span> <span class="n">CPPPlots</span><span class="p">(</span><span class="o">**</span><span class="n">args_len</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="n">start</span><span class="p">)</span>
-        <span class="k">try</span><span class="p">:</span>
-            <span class="n">ax</span> <span class="o">=</span> <span class="n">cpp_plot</span><span class="o">.</span><span class="n">profile</span><span class="p">(</span><span class="n">df_pos</span><span class="o">=</span><span class="n">df_pos</span><span class="p">,</span> <span class="n">figsize</span><span class="o">=</span><span class="n">figsize</span><span class="p">,</span> <span class="n">ylim</span><span class="o">=</span><span class="n">ylim</span><span class="p">,</span>
-                                  <span class="n">dict_color</span><span class="o">=</span><span class="n">dict_color</span><span class="p">,</span> <span class="n">edge_color</span><span class="o">=</span><span class="n">edge_color</span><span class="p">,</span> <span class="n">bar_width</span><span class="o">=</span><span class="n">bar_width</span><span class="p">,</span>
-                                  <span class="n">add_legend</span><span class="o">=</span><span class="n">add_legend_cat</span><span class="p">,</span> <span class="n">legend_kws</span><span class="o">=</span><span class="n">legend_kws</span><span class="p">,</span> <span class="n">shap_plot</span><span class="o">=</span><span class="n">shap_plot</span><span class="p">,</span>
-                                  <span class="o">**</span><span class="n">args_xtick</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-        <span class="k">except</span> <span class="ne">AttributeError</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-            <span class="n">error_message</span> <span class="o">=</span> <span class="n">check_parameters</span><span class="p">(</span><span class="n">func</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">profile</span><span class="p">,</span> <span class="n">name_called_func</span><span class="o">=</span><span class="s2">&quot;pd.DataFrame.plot&quot;</span><span class="p">,</span> <span class="n">e</span><span class="o">=</span><span class="n">e</span><span class="p">)</span>
-            <span class="k">raise</span> <span class="ne">AttributeError</span><span class="p">(</span><span class="n">error_message</span><span class="p">)</span>
-        <span class="n">cpp_plot</span><span class="o">.</span><span class="n">set_title</span><span class="p">(</span><span class="n">title</span><span class="o">=</span><span class="n">title</span><span class="p">,</span> <span class="n">title_kws</span><span class="o">=</span><span class="n">title_kws</span><span class="p">)</span>
-
-        <span class="c1"># Autosize tmd sequence &amp; annotation</span>
-        <span class="n">opt_size</span> <span class="o">=</span> <span class="n">cpp_plot</span><span class="o">.</span><span class="n">optimize_label_size</span><span class="p">(</span><span class="n">ax</span><span class="o">=</span><span class="n">ax</span><span class="p">,</span> <span class="n">df_pos</span><span class="o">=</span><span class="n">df_pos</span><span class="p">,</span> <span class="n">label_term</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-        <span class="c1"># Set default ylabel</span>
-        <span class="n">ylabel</span> <span class="o">=</span> <span class="s2">&quot;Feature impact&quot;</span> <span class="k">if</span> <span class="n">shap_plot</span> <span class="k">else</span> <span class="sa">f</span><span class="s2">&quot;Feature count (-/+ </span><span class="si">{</span><span class="n">val_col</span><span class="si">}</span><span class="s2">)&quot;</span>
-        <span class="n">ax</span><span class="o">.</span><span class="n">set_ylabel</span><span class="p">(</span><span class="n">ylabel</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="n">opt_size</span><span class="p">)</span>
-        <span class="c1"># Adjust y ticks</span>
-        <span class="n">ytick_size</span> <span class="o">=</span> <span class="n">opt_size</span> <span class="k">if</span> <span class="n">ytick_size</span> <span class="ow">is</span> <span class="kc">None</span> <span class="k">else</span> <span class="n">ytick_size</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">yticks</span><span class="p">(</span><span class="n">size</span><span class="o">=</span><span class="n">ytick_size</span><span class="p">)</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">tick_params</span><span class="p">(</span><span class="n">axis</span><span class="o">=</span><span class="s2">&quot;y&quot;</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="s2">&quot;black&quot;</span><span class="p">,</span> <span class="n">width</span><span class="o">=</span><span class="n">ytick_width</span><span class="p">,</span> <span class="n">length</span><span class="o">=</span><span class="n">ytick_length</span><span class="p">,</span> <span class="n">bottom</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-        <span class="n">sns</span><span class="o">.</span><span class="n">despine</span><span class="p">(</span><span class="n">top</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">right</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-        <span class="c1"># Add grid</span>
-        <span class="k">if</span> <span class="n">grid</span><span class="p">:</span>
-            <span class="n">ax</span><span class="o">.</span><span class="n">set_axisbelow</span><span class="p">(</span><span class="kc">True</span><span class="p">)</span>  <span class="c1"># Grid behind datasets</span>
-            <span class="n">ax</span><span class="o">.</span><span class="n">grid</span><span class="p">(</span><span class="n">which</span><span class="o">=</span><span class="s2">&quot;major&quot;</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="n">grid_axis</span><span class="p">,</span> <span class="n">linestyle</span><span class="o">=</span><span class="s2">&quot;-&quot;</span><span class="p">)</span>
-        <span class="c1"># Add tmd area</span>
-        <span class="k">if</span> <span class="n">highlight_tmd_area</span><span class="p">:</span>
-            <span class="n">cpp_plot</span><span class="o">.</span><span class="n">highlight_tmd_area</span><span class="p">(</span><span class="n">ax</span><span class="o">=</span><span class="n">ax</span><span class="p">,</span> <span class="n">x_shift</span><span class="o">=-</span><span class="mf">0.5</span><span class="p">,</span> <span class="n">tmd_color</span><span class="o">=</span><span class="n">tmd_color</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="n">highlight_alpha</span><span class="p">)</span>
-        <span class="c1"># Add tmd_jmd sequence if sequence is given</span>
-        <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">tmd_seq</span><span class="p">)</span> <span class="o">==</span> <span class="nb">str</span><span class="p">:</span>
-            <span class="n">ax</span> <span class="o">=</span> <span class="n">cpp_plot</span><span class="o">.</span><span class="n">add_tmd_jmd_seq</span><span class="p">(</span><span class="n">ax</span><span class="o">=</span><span class="n">ax</span><span class="p">,</span> <span class="o">**</span><span class="n">args_seq</span><span class="p">,</span> <span class="o">**</span><span class="n">args_size</span><span class="p">,</span> <span class="o">**</span><span class="n">args_part_color</span><span class="p">,</span> <span class="o">**</span><span class="n">args_seq_color</span><span class="p">,</span>
-                                          <span class="n">xticks_pos</span><span class="o">=</span><span class="n">xticks_pos</span><span class="p">,</span> <span class="n">heatmap</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">x_shift</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                                          <span class="n">xtick_size</span><span class="o">=</span><span class="n">xtick_size</span><span class="p">)</span>  <span class="c1"># Add tmd_jmd bar</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">ax_seq</span> <span class="o">=</span> <span class="n">ax</span>
-        <span class="k">elif</span> <span class="n">add_jmd_tmd</span><span class="p">:</span>
-            <span class="n">size</span> <span class="o">=</span> <span class="n">opt_size</span> <span class="k">if</span> <span class="n">tmd_jmd_fontsize</span> <span class="ow">is</span> <span class="kc">None</span> <span class="k">else</span> <span class="n">tmd_jmd_fontsize</span>
-            <span class="n">cpp_plot</span><span class="o">.</span><span class="n">add_tmd_jmd_bar</span><span class="p">(</span><span class="n">ax</span><span class="o">=</span><span class="n">ax</span><span class="p">,</span> <span class="n">x_shift</span><span class="o">=-</span><span class="mf">0.5</span><span class="p">,</span> <span class="o">**</span><span class="n">args_part_color</span><span class="p">,</span> <span class="n">add_white_bar</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-            <span class="n">cpp_plot</span><span class="o">.</span><span class="n">add_tmd_jmd_xticks</span><span class="p">(</span><span class="n">ax</span><span class="o">=</span><span class="n">ax</span><span class="p">,</span> <span class="n">x_shift</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="o">**</span><span class="n">args_xtick</span><span class="p">)</span>
-            <span class="n">cpp_plot</span><span class="o">.</span><span class="n">add_tmd_jmd_text</span><span class="p">(</span><span class="n">ax</span><span class="o">=</span><span class="n">ax</span><span class="p">,</span> <span class="n">x_shift</span><span class="o">=-</span><span class="mf">0.5</span><span class="p">,</span> <span class="n">tmd_jmd_fontsize</span><span class="o">=</span><span class="n">size</span><span class="p">)</span>
-
-        <span class="c1"># Set current axis to main axis object depending on tmd sequence given or not</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">yticks</span><span class="p">(</span><span class="n">size</span><span class="o">=</span><span class="n">ytick_size</span><span class="p">)</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">tick_params</span><span class="p">(</span><span class="n">axis</span><span class="o">=</span><span class="s2">&quot;y&quot;</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="s2">&quot;black&quot;</span><span class="p">,</span> <span class="n">width</span><span class="o">=</span><span class="n">ytick_width</span><span class="p">,</span> <span class="n">length</span><span class="o">=</span><span class="n">ytick_length</span><span class="p">,</span> <span class="n">bottom</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">sca</span><span class="p">(</span><span class="n">plt</span><span class="o">.</span><span class="n">gcf</span><span class="p">()</span><span class="o">.</span><span class="n">axes</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
-        <span class="n">ax</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">gca</span><span class="p">()</span>
-        <span class="k">return</span> <span class="n">ax</span></div>
-
-<div class="viewcode-block" id="CPPPlot.heatmap"><a class="viewcode-back" href="../../../generated/aaanalysis.CPPPlot.html#aaanalysis.CPPPlot.heatmap">[docs]</a>    <span class="k">def</span> <span class="nf">heatmap</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">df_feat</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">y</span><span class="o">=</span><span class="s2">&quot;subcategory&quot;</span><span class="p">,</span> <span class="n">val_col</span><span class="o">=</span><span class="s2">&quot;mean_dif&quot;</span><span class="p">,</span> <span class="n">val_type</span><span class="o">=</span><span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-                <span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">8</span><span class="p">,</span> <span class="mi">5</span><span class="p">),</span> <span class="n">title</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">title_kws</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                <span class="n">vmin</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">vmax</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">grid_on</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-                <span class="n">cmap</span><span class="o">=</span><span class="s2">&quot;RdBu_r&quot;</span><span class="p">,</span> <span class="n">cmap_n_colors</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">dict_color</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">cbar_kws</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">facecolor_dark</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-                <span class="n">add_jmd_tmd</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">tmd_len</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-                <span class="n">jmd_n_seq</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">tmd_seq</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">jmd_c_seq</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                <span class="n">tmd_color</span><span class="o">=</span><span class="s2">&quot;mediumspringgreen&quot;</span><span class="p">,</span> <span class="n">jmd_color</span><span class="o">=</span><span class="s2">&quot;blue&quot;</span><span class="p">,</span> <span class="n">tmd_seq_color</span><span class="o">=</span><span class="s2">&quot;black&quot;</span><span class="p">,</span> <span class="n">jmd_seq_color</span><span class="o">=</span><span class="s2">&quot;white&quot;</span><span class="p">,</span>
-                <span class="n">seq_size</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">tmd_jmd_fontsize</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                <span class="n">xticks_pos</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">xtick_size</span><span class="o">=</span><span class="mf">11.0</span><span class="p">,</span> <span class="n">xtick_width</span><span class="o">=</span><span class="mf">2.0</span><span class="p">,</span> <span class="n">xtick_length</span><span class="o">=</span><span class="mf">5.0</span><span class="p">,</span> <span class="n">ytick_size</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                <span class="n">add_legend_cat</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">legend_kws</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                <span class="n">add_importance_map</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">cbar_pct</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Plot a featuremap of the selected value column with scale information (y-axis) versus sequence position (x-axis).</span>
-
-<span class="sd">        This is a wrapper function for :func:`seaborn.heatmap`, designed to highlight differences between two sets</span>
-<span class="sd">        of sequences at the positional level (e.g., amino acid level for protein sequences).</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        df_feat : :class:`~pandas.DataFrame`, shape (n_feature, n_feature_information)</span>
-<span class="sd">            DataFrame containing unique identifiers, scale information, statistics, and positions for each feature.</span>
-<span class="sd">        y : {&#39;category&#39;, &#39;subcategory&#39;, &#39;scale_name&#39;}, str, default = &#39;subcategory&#39;</span>
-<span class="sd">            Name of the column in the feature DataFrame representing scale information (shown on the y-axis).</span>
-<span class="sd">        val_col : {&#39;mean_dif&#39;, &#39;feat_impact&#39;, &#39;abs_auc&#39;, &#39;std_test&#39;, ...}, str, default = &#39;mean_dif&#39;</span>
-<span class="sd">            Name of the column in the feature DataFrame containing numerical values to display.</span>
-<span class="sd">        val_type : {&#39;mean&#39;, &#39;sum&#39;, &#39;std&#39;}, str, default = &#39;mean&#39;</span>
-<span class="sd">            Method to aggregate numerical values from &#39;val_col&#39;.</span>
-<span class="sd">        normalize : {True, False, &#39;positions&#39;, &#39;positions_only&#39;}, bool/str, default = False</span>
-<span class="sd">            Specifies normalization for numerical values in &#39;val_col&#39;:</span>
-
-<span class="sd">            - False: Set value at all positions of a feature without further normalization.</span>
-
-<span class="sd">            - True: Set value at all positions of a feature and normalize across all features.</span>
-
-<span class="sd">            - &#39;positions&#39;: Value/number of positions set at each position of a feature and normalized across features.</span>
-<span class="sd">              Recommended when aiming to emphasize features with fewer positions using &#39;val_col&#39;=&#39;feat_impact&#39; and &#39;value_type&#39;=&#39;mean&#39;.</span>
-
-<span class="sd">        figsize : tuple(float, float), default = (10,7)</span>
-<span class="sd">            Width and height of the figure in inches passed to :func:`matplotlib.pyplot.figure`.</span>
-<span class="sd">        title : str, optional</span>
-<span class="sd">            Title of figure used by :func:`matplotlib.pyplot.title`.</span>
-<span class="sd">        title_kws : dict, optional</span>
-<span class="sd">            Keyword arguments passed to :func:`matplotlib.pyplot.title`.</span>
-<span class="sd">        vmin, vmax : float, optional</span>
-<span class="sd">            Values to anchor the colormap, otherwise, inferred from data and other keyword arguments.</span>
-<span class="sd">        cmap : matplotlib colormap name or object, or list of colors, default = &#39;seismic&#39;</span>
-<span class="sd">            Name of color map assigning data values to color space. If &#39;SHAP&#39;, colors from</span>
-<span class="sd">            `SHAP &lt;https://shap.readthedocs.io/en/latest/index.html&gt;`_ will be used (recommended for feature impact).</span>
-<span class="sd">        cmap_n_colors : int, optional</span>
-<span class="sd">            Number of discrete steps in diverging or sequential color map.</span>
-<span class="sd">        dict_color : dict, optional</span>
-<span class="sd">            Map of colors for scale categories classifying scales shown on y-axis.</span>
-<span class="sd">        cbar_kws : dict of key, value mappings, optional</span>
-<span class="sd">            Keyword arguments for :meth:`matplotlib.figure.Figure.colorbar`.</span>
-<span class="sd">        add_jmd_tmd : bool, default = True</span>
-<span class="sd">            Whether to add colored bar under heatmap indicating sequence parts (JMD-N, TMD, JMD-C).</span>
-<span class="sd">        tmd_len : int, &gt;0</span>
-<span class="sd">            Length of TMD to be depiceted.</span>
-<span class="sd">        start : int, &gt;=0</span>
-<span class="sd">            Position label of first amino acid position (starting at N-terminus).</span>
-<span class="sd">        tmd_seq : str, optional</span>
-<span class="sd">            Sequence of TMD. &#39;tmd_len&#39; is set to length of TMD if sequence for TMD, JMD-N and JMD-C are given.</span>
-<span class="sd">            Recommended if feature impact or mean difference should be depicted for one sample.</span>
-<span class="sd">        jmd_n_seq : str, optional</span>
-<span class="sd">            Sequence of JMD_N. &#39;jmd_n_len&#39; is set to length of JMD_N if sequence for TMD, JMD-N and JMD-C are given.</span>
-<span class="sd">            Recommended if feature impact or mean difference should be depicted for one sample.</span>
-<span class="sd">        jmd_c_seq : str, optional</span>
-<span class="sd">            Sequence of JMD_C. &#39;jmd_c_len&#39; is set to length of JMD_C if sequence for TMD, JMD-N and JMD-C are given.</span>
-<span class="sd">            Recommended if feature impact or mean difference should be depicted for one sample.</span>
-<span class="sd">        tmd_color : str, default = &#39;mediumspringgreen&#39;</span>
-<span class="sd">            Color of TMD bar.</span>
-<span class="sd">        jmd_color : str, default = &#39;blue&#39;</span>
-<span class="sd">            Color of JMD-N and JMD-C bar.</span>
-<span class="sd">        tmd_seq_color : str, default = &#39;black&#39;</span>
-<span class="sd">            Color of TMD sequence.</span>
-<span class="sd">        jmd_seq_color : str, default = &#39;white&#39;</span>
-<span class="sd">            Color of JMD-N and JMD-C sequence.</span>
-<span class="sd">        seq_size : float, optional</span>
-<span class="sd">            Font size of all sequence parts in points. If None, optimized automatically.</span>
-<span class="sd">        tmd_jmd_fontsize : float, optional</span>
-<span class="sd">            Font size of &#39;TMD&#39;, &#39;JMD-N&#39; and &#39;JMD-C&#39;  label in points. If None, optimized automatically.</span>
-<span class="sd">        xtick_size : float, default = 11.0</span>
-<span class="sd">            Size of x ticks in points. Passed as &#39;size&#39; argument to :meth:`matplotlib.axes.Axes.set_xticklabels`.</span>
-<span class="sd">        xtick_width : float, default = 2.0</span>
-<span class="sd">            Widht of x ticks in points. Passed as &#39;width&#39; argument to :meth:`matplotlib.axes.Axes.tick_params`.</span>
-<span class="sd">        xtick_length : float, default = 5.0,</span>
-<span class="sd">            Length of x ticks in points. Passed as &#39;length&#39; argument to :meth:`matplotlib.axes.Axes.tick_params`.</span>
-<span class="sd">        ytick_size : float, optional</span>
-<span class="sd">            Size of scale information as y ticks in points. Passed to :meth:`matplotlib.axes.Axes.tick_params`.</span>
-<span class="sd">            If None, optimized automatically.</span>
-<span class="sd">        add_legend_cat : bool, default = True,</span>
-<span class="sd">            Whether to add legend for categories under plot and classification of scales at y-axis.</span>
-<span class="sd">        legend_kws : dict, optional</span>
-<span class="sd">            Keyword arguments passed to :meth:`matplotlib.axes.Axes.legend`</span>
-<span class="sd">        kwargs : other keyword arguments</span>
-<span class="sd">            All other keyword arguments passed to :meth:`matplotlib.axes.Axes.pcolormesh`.</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        ax : matplotlib Axes</span>
-<span class="sd">        Axes object containing the heatmap.</span>
-
-<span class="sd">        Warnings</span>
-<span class="sd">        --------</span>
-<span class="sd">        - &#39;cmap_n_colors&#39; is effective only if &#39;vmin&#39; and &#39;vmax&#39; align with the data.</span>
-
-<span class="sd">        - &#39;tmd_seq_color&#39; and &#39;jmd_seq_color&#39; are applicable only when &#39;tmd_seq&#39;, &#39;jmd_n_seq&#39;, and &#39;jmd_c_seq&#39; are provided.</span>
-
-<span class="sd">        See Also</span>
-<span class="sd">        --------</span>
-<span class="sd">        seaborn.heatmap</span>
-<span class="sd">            Plotting heatmap using seaborn.</span>
-<span class="sd">            See `Seaborn documentation &lt;https://seaborn.pydata.org/generated/seaborn.heatmap.html&gt;`_ for more details.</span>
-
-<span class="sd">        Examples</span>
-<span class="sd">        --------</span>
-
-<span class="sd">        Plot CPP feature heatmap:</span>
-
-<span class="sd">        .. plot::</span>
-<span class="sd">            :context: close-figs</span>
-
-<span class="sd">            &gt;&gt;&gt; import matplotlib.pyplot as plt</span>
-<span class="sd">            &gt;&gt;&gt; import aaanalysis as aa</span>
-<span class="sd">            &gt;&gt;&gt; sf = aa.SequenceFeature()</span>
-<span class="sd">            &gt;&gt;&gt; df_seq = aa.load_dataset(name=&#39;SEQ_DISULFIDE&#39;, min_len=100)</span>
-<span class="sd">            &gt;&gt;&gt; labels = list(df_seq[&quot;label&quot;])</span>
-<span class="sd">            &gt;&gt;&gt; df_parts = sf.get_df_parts(df_seq=df_seq, jmd_n_len=10, jmd_c_len=10)</span>
-<span class="sd">            &gt;&gt;&gt; #split_kws = sf.get_split_kws(n_split_min=1, n_split_max=3, split_types=[&quot;Segment&quot;, &quot;PeriodicPattern&quot;])</span>
-<span class="sd">            &gt;&gt;&gt; #df_scales = aa.load_scales(unclassified_in=False).sample(n=10, axis=1)</span>
-<span class="sd">            &gt;&gt;&gt; #cpp = aa.CPP(df_parts=df_parts, split_kws=split_kws, df_scales=df_scales)</span>
-<span class="sd">            &gt;&gt;&gt; #df_feat = cpp.run(labels=labels)</span>
-<span class="sd">            &gt;&gt;&gt; #cpp.plot_heatmap(df_feat=df_feat)</span>
-<span class="sd">            &gt;&gt;&gt; #plt.tight_layout()</span>
-
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="c1"># Group arguments</span>
-        <span class="n">args_seq</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">jmd_n_seq</span><span class="o">=</span><span class="n">jmd_n_seq</span><span class="p">,</span> <span class="n">tmd_seq</span><span class="o">=</span><span class="n">tmd_seq</span><span class="p">,</span> <span class="n">jmd_c_seq</span><span class="o">=</span><span class="n">jmd_c_seq</span><span class="p">)</span>
-        <span class="n">args_size</span> <span class="o">=</span> <span class="n">check_args_size</span><span class="p">(</span><span class="n">seq_size</span><span class="o">=</span><span class="n">seq_size</span><span class="p">,</span> <span class="n">tmd_jmd_fontsize</span><span class="o">=</span><span class="n">tmd_jmd_fontsize</span><span class="p">)</span>
-        <span class="n">args_len</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_args_len</span><span class="p">(</span><span class="n">tmd_len</span><span class="o">=</span><span class="n">tmd_len</span><span class="p">,</span> <span class="n">jmd_n_len</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">jmd_n_len</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">jmd_c_len</span><span class="p">,</span> <span class="o">**</span><span class="n">args_seq</span><span class="p">)</span>
-        <span class="n">args_xtick</span> <span class="o">=</span> <span class="n">check_args_xtick</span><span class="p">(</span><span class="n">xtick_size</span><span class="o">=</span><span class="n">xtick_size</span><span class="p">,</span> <span class="n">xtick_width</span><span class="o">=</span><span class="n">xtick_width</span><span class="p">,</span> <span class="n">xtick_length</span><span class="o">=</span><span class="n">xtick_length</span><span class="p">)</span>
-        <span class="n">args_part_color</span> <span class="o">=</span> <span class="n">check_part_color</span><span class="p">(</span><span class="n">tmd_color</span><span class="o">=</span><span class="n">tmd_color</span><span class="p">,</span> <span class="n">jmd_color</span><span class="o">=</span><span class="n">jmd_color</span><span class="p">)</span>
-        <span class="n">args_seq_color</span> <span class="o">=</span> <span class="n">check_seq_color</span><span class="p">(</span><span class="n">tmd_seq_color</span><span class="o">=</span><span class="n">tmd_seq_color</span><span class="p">,</span> <span class="n">jmd_seq_color</span><span class="o">=</span><span class="n">jmd_seq_color</span><span class="p">)</span>
-
-        <span class="c1"># Checking input</span>
-        <span class="c1"># Args checked by Matplotlib: title, cmap, cbar_kws, legend_kws</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;start&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">start</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;ytick_size&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">ytick_size</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;cmap_n_colors&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">cmap_n_colors</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_bool</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;add_jmd_tmd&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">add_jmd_tmd</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_bool</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;add_legend_cat&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">add_legend_cat</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_dict</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;legend_kws&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">legend_kws</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_dict</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;cbar_kws&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">cbar_kws</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_col_in_df</span><span class="p">(</span><span class="n">df</span><span class="o">=</span><span class="n">df_feat</span><span class="p">,</span> <span class="n">name_df</span><span class="o">=</span><span class="s2">&quot;df_feat&quot;</span><span class="p">,</span> <span class="n">col</span><span class="o">=</span><span class="n">val_col</span><span class="p">,</span> <span class="n">col_type</span><span class="o">=</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">])</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_y_categorical</span><span class="p">(</span><span class="n">df</span><span class="o">=</span><span class="n">df_feat</span><span class="p">,</span> <span class="n">y</span><span class="o">=</span><span class="n">y</span><span class="p">)</span>
-        <span class="n">df_feat</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_df_feat</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="n">df_feat</span><span class="p">,</span> <span class="n">df_cat</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">df_cat</span><span class="p">)</span>
-        <span class="n">check_value_type</span><span class="p">(</span><span class="n">val_type</span><span class="o">=</span><span class="n">val_type</span><span class="p">,</span> <span class="n">count_in</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-        <span class="n">check_vmin_vmax</span><span class="p">(</span><span class="n">vmin</span><span class="o">=</span><span class="n">vmin</span><span class="p">,</span> <span class="n">vmax</span><span class="o">=</span><span class="n">vmax</span><span class="p">)</span>
-        <span class="n">check_figsize</span><span class="p">(</span><span class="n">figsize</span><span class="o">=</span><span class="n">figsize</span><span class="p">)</span>
-        <span class="n">dict_color</span> <span class="o">=</span> <span class="n">check_dict_color</span><span class="p">(</span><span class="n">dict_color</span><span class="o">=</span><span class="n">dict_color</span><span class="p">,</span> <span class="n">df_cat</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">df_cat</span><span class="p">)</span>
-
-        <span class="c1"># Get df positions</span>
-        <span class="n">df_feat</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">add_positions</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="n">df_feat</span><span class="p">,</span> <span class="n">tmd_len</span><span class="o">=</span><span class="n">args_len</span><span class="p">[</span><span class="s2">&quot;tmd_len&quot;</span><span class="p">],</span> <span class="n">start</span><span class="o">=</span><span class="n">start</span><span class="p">)</span>
-        <span class="n">df_pos</span> <span class="o">=</span> <span class="n">_get_df_pos</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="n">df_feat</span><span class="p">,</span> <span class="n">df_cat</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">df_cat</span><span class="p">,</span> <span class="n">y</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">val_col</span><span class="o">=</span><span class="n">val_col</span><span class="p">,</span>
-                             <span class="n">value_type</span><span class="o">=</span><span class="n">val_type</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="n">normalize</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="n">start</span><span class="p">,</span> <span class="o">**</span><span class="n">args_len</span><span class="p">)</span>
-        <span class="c1"># Plotting</span>
-        <span class="n">cpp_plot</span> <span class="o">=</span> <span class="n">CPPPlots</span><span class="p">(</span><span class="o">**</span><span class="n">args_len</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="n">start</span><span class="p">)</span>
-        <span class="n">cpp_plot</span><span class="o">.</span><span class="n">set_figsize</span><span class="p">(</span><span class="n">figsize</span><span class="o">=</span><span class="n">figsize</span><span class="p">)</span>   <span class="c1"># figsize is not used as argument in seaborn (but in pandas)</span>
-        <span class="k">try</span><span class="p">:</span>
-            <span class="n">linecolor</span> <span class="o">=</span> <span class="s2">&quot;gray&quot;</span> <span class="k">if</span> <span class="n">facecolor_dark</span> <span class="k">else</span> <span class="s2">&quot;black&quot;</span>
-            <span class="k">if</span> <span class="s2">&quot;linecolor&quot;</span> <span class="ow">in</span> <span class="n">kwargs</span><span class="p">:</span>
-                <span class="n">linecolor</span> <span class="o">=</span> <span class="n">kwargs</span><span class="p">[</span><span class="s2">&quot;linecolor&quot;</span><span class="p">]</span>
-            <span class="k">else</span><span class="p">:</span>
-                <span class="n">kwargs</span><span class="p">[</span><span class="s2">&quot;linecolor&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">linecolor</span>
-            <span class="n">ax</span> <span class="o">=</span> <span class="n">cpp_plot</span><span class="o">.</span><span class="n">heatmap</span><span class="p">(</span><span class="n">df_pos</span><span class="o">=</span><span class="n">df_pos</span><span class="p">,</span> <span class="n">vmin</span><span class="o">=</span><span class="n">vmin</span><span class="p">,</span> <span class="n">vmax</span><span class="o">=</span><span class="n">vmax</span><span class="p">,</span> <span class="n">grid_on</span><span class="o">=</span><span class="n">grid_on</span><span class="p">,</span>
-                                  <span class="n">cmap</span><span class="o">=</span><span class="n">cmap</span><span class="p">,</span> <span class="n">cmap_n_colors</span><span class="o">=</span><span class="n">cmap_n_colors</span><span class="p">,</span> <span class="n">cbar_kws</span><span class="o">=</span><span class="n">cbar_kws</span><span class="p">,</span>
-                                  <span class="n">x_shift</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span> <span class="n">ytick_size</span><span class="o">=</span><span class="n">ytick_size</span><span class="p">,</span> <span class="n">facecolor_dark</span><span class="o">=</span><span class="n">facecolor_dark</span><span class="p">,</span>
-                                  <span class="n">cbar_pct</span><span class="o">=</span><span class="n">cbar_pct</span><span class="p">,</span> <span class="o">**</span><span class="n">args_xtick</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-            <span class="n">ax</span><span class="o">.</span><span class="n">axvline</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">jmd_n_len</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="n">linecolor</span><span class="p">,</span> <span class="n">linestyle</span><span class="o">=</span><span class="s2">&quot;-&quot;</span><span class="p">,</span> <span class="n">linewidth</span><span class="o">=</span><span class="mf">1.5</span><span class="p">)</span>
-            <span class="n">ax</span><span class="o">.</span><span class="n">axvline</span><span class="p">(</span><span class="n">x</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">jmd_n_len</span> <span class="o">+</span> <span class="n">args_len</span><span class="p">[</span><span class="s2">&quot;tmd_len&quot;</span><span class="p">],</span> <span class="n">color</span><span class="o">=</span><span class="n">linecolor</span><span class="p">,</span> <span class="n">linestyle</span><span class="o">=</span><span class="s2">&quot;-&quot;</span><span class="p">,</span> <span class="n">linewidth</span><span class="o">=</span><span class="mf">1.5</span><span class="p">)</span>
-
-        <span class="k">except</span> <span class="ne">AttributeError</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-            <span class="n">error_message</span> <span class="o">=</span> <span class="n">check_parameters</span><span class="p">(</span><span class="n">func</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">heatmap</span><span class="p">,</span> <span class="n">name_called_func</span><span class="o">=</span><span class="s2">&quot;sns.heatmap&quot;</span><span class="p">,</span> <span class="n">e</span><span class="o">=</span><span class="n">e</span><span class="p">)</span>
-            <span class="k">raise</span> <span class="ne">AttributeError</span><span class="p">(</span><span class="n">error_message</span><span class="p">)</span>
-        <span class="n">cpp_plot</span><span class="o">.</span><span class="n">set_title</span><span class="p">(</span><span class="n">title</span><span class="o">=</span><span class="n">title</span><span class="p">,</span> <span class="n">title_kws</span><span class="o">=</span><span class="n">title_kws</span><span class="p">)</span>
-        <span class="c1"># Autosize tmd sequence &amp; annotation</span>
-        <span class="n">opt_size</span> <span class="o">=</span> <span class="n">cpp_plot</span><span class="o">.</span><span class="n">optimize_label_size</span><span class="p">(</span><span class="n">ax</span><span class="o">=</span><span class="n">ax</span><span class="p">,</span> <span class="n">df_pos</span><span class="o">=</span><span class="n">df_pos</span><span class="p">)</span>
-        <span class="c1"># Add importance map</span>
-        <span class="k">if</span> <span class="n">add_importance_map</span><span class="p">:</span>
-            <span class="n">_add_importance_map</span><span class="p">(</span><span class="n">ax</span><span class="o">=</span><span class="n">ax</span><span class="p">,</span> <span class="n">df_feat</span><span class="o">=</span><span class="n">df_feat</span><span class="p">,</span> <span class="n">df_cat</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">df_cat</span><span class="p">,</span>
-                                <span class="n">start</span><span class="o">=</span><span class="n">start</span><span class="p">,</span> <span class="n">args_len</span><span class="o">=</span><span class="n">args_len</span><span class="p">,</span> <span class="n">y</span><span class="o">=</span><span class="n">y</span><span class="p">)</span>
-        <span class="c1"># Add scale classification</span>
-        <span class="k">if</span> <span class="n">add_legend_cat</span><span class="p">:</span>
-            <span class="n">ax</span> <span class="o">=</span> <span class="n">cpp_plot</span><span class="o">.</span><span class="n">add_legend_cat</span><span class="p">(</span><span class="n">ax</span><span class="o">=</span><span class="n">ax</span><span class="p">,</span> <span class="n">df_pos</span><span class="o">=</span><span class="n">df_pos</span><span class="p">,</span> <span class="n">df_cat</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">df_cat</span><span class="p">,</span> <span class="n">y</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">dict_color</span><span class="o">=</span><span class="n">dict_color</span><span class="p">,</span>
-                                         <span class="n">legend_kws</span><span class="o">=</span><span class="n">legend_kws</span><span class="p">)</span>
-        <span class="c1"># Add tmd_jmd sequence if sequence is given</span>
-        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">tmd_seq</span><span class="p">,</span> <span class="nb">str</span><span class="p">):</span>
-            <span class="n">ax</span> <span class="o">=</span> <span class="n">cpp_plot</span><span class="o">.</span><span class="n">add_tmd_jmd_seq</span><span class="p">(</span><span class="n">ax</span><span class="o">=</span><span class="n">ax</span><span class="p">,</span> <span class="o">**</span><span class="n">args_seq</span><span class="p">,</span> <span class="o">**</span><span class="n">args_size</span><span class="p">,</span> <span class="o">**</span><span class="n">args_part_color</span><span class="p">,</span> <span class="o">**</span><span class="n">args_seq_color</span><span class="p">,</span>
-                                          <span class="n">xticks_pos</span><span class="o">=</span><span class="n">xticks_pos</span><span class="p">,</span>
-                                          <span class="n">x_shift</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span> <span class="n">xtick_size</span><span class="o">=</span><span class="n">xtick_size</span><span class="p">)</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">ax_seq</span> <span class="o">=</span> <span class="n">ax</span>
-        <span class="c1"># Add tmd_jmd bar</span>
-        <span class="k">elif</span> <span class="n">add_jmd_tmd</span><span class="p">:</span>
-            <span class="n">size</span> <span class="o">=</span> <span class="n">opt_size</span> <span class="k">if</span> <span class="n">tmd_jmd_fontsize</span> <span class="ow">is</span> <span class="kc">None</span> <span class="k">else</span> <span class="n">tmd_jmd_fontsize</span>
-            <span class="n">cpp_plot</span><span class="o">.</span><span class="n">add_tmd_jmd_bar</span><span class="p">(</span><span class="n">ax</span><span class="o">=</span><span class="n">ax</span><span class="p">,</span> <span class="o">**</span><span class="n">args_part_color</span><span class="p">)</span>
-            <span class="n">cpp_plot</span><span class="o">.</span><span class="n">add_tmd_jmd_xticks</span><span class="p">(</span><span class="n">ax</span><span class="o">=</span><span class="n">ax</span><span class="p">,</span> <span class="n">x_shift</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span> <span class="o">**</span><span class="n">args_xtick</span><span class="p">)</span>
-            <span class="n">cpp_plot</span><span class="o">.</span><span class="n">add_tmd_jmd_text</span><span class="p">(</span><span class="n">ax</span><span class="o">=</span><span class="n">ax</span><span class="p">,</span> <span class="n">x_shift</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">tmd_jmd_fontsize</span><span class="o">=</span><span class="n">size</span><span class="p">)</span>
-        <span class="c1"># Set current axis to main axis object depending on tmd sequence given or not</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">sca</span><span class="p">(</span><span class="n">plt</span><span class="o">.</span><span class="n">gcf</span><span class="p">()</span><span class="o">.</span><span class="n">axes</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
-        <span class="n">ax</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">gca</span><span class="p">()</span>
-        <span class="k">return</span> <span class="n">ax</span></div>
-
-<div class="viewcode-block" id="CPPPlot.update_seq_size"><a class="viewcode-back" href="../../../generated/aaanalysis.CPPPlot.html#aaanalysis.CPPPlot.update_seq_size">[docs]</a>    <span class="k">def</span> <span class="nf">update_seq_size</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span>
-        <span class="c1"># TODO legend changes slightly if sequnece length altered (e.g. PTPRM_MOUSE vs A4_HUMAN)</span>
-        <span class="c1"># TODO look for more extreme example and text</span>
-        <span class="n">f</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">l</span><span class="p">:</span> <span class="n">l</span><span class="o">.</span><span class="n">get_window_extent</span><span class="p">(</span><span class="n">ax</span><span class="o">.</span><span class="n">figure</span><span class="o">.</span><span class="n">canvas</span><span class="o">.</span><span class="n">get_renderer</span><span class="p">())</span>
-        <span class="n">ax</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">ax_seq</span>
-        <span class="n">labels</span> <span class="o">=</span> <span class="n">ax</span><span class="o">.</span><span class="n">xaxis</span><span class="o">.</span><span class="n">get_ticklabels</span><span class="p">(</span><span class="n">which</span><span class="o">=</span><span class="s2">&quot;both&quot;</span><span class="p">)</span>
-        <span class="n">tick_positions</span> <span class="o">=</span> <span class="p">[</span><span class="n">f</span><span class="p">(</span><span class="n">l</span><span class="p">)</span><span class="o">.</span><span class="n">x0</span> <span class="k">for</span> <span class="n">l</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">]</span>
-        <span class="n">sorted_tick_positions</span><span class="p">,</span> <span class="n">sorted_labels</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span><span class="o">*</span><span class="nb">sorted</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">tick_positions</span><span class="p">,</span> <span class="n">labels</span><span class="p">),</span> <span class="n">key</span><span class="o">=</span><span class="k">lambda</span> <span class="n">t</span><span class="p">:</span> <span class="n">t</span><span class="p">[</span><span class="mi">0</span><span class="p">]))</span>
-        <span class="c1"># Adjust font size to prevent overlap</span>
-        <span class="n">seq_size</span> <span class="o">=</span> <span class="n">get_optimal_fontsize</span><span class="p">(</span><span class="n">ax</span><span class="p">,</span> <span class="n">sorted_labels</span><span class="p">)</span>
-        <span class="k">for</span> <span class="n">l</span> <span class="ow">in</span> <span class="n">sorted_labels</span><span class="p">:</span>
-            <span class="n">l</span><span class="o">.</span><span class="n">set_fontsize</span><span class="p">(</span><span class="n">seq_size</span><span class="p">)</span></div></div>
-</pre></div>
-
-           </div>
-          </div>
-          <footer>
-
-  <hr/>
-
-  <div role="contentinfo">
-    <p>&#169; Copyright 2023, Stephan Breimann.</p>
-  </div>
-
-   
-
-</footer>
-        </div>
-      </div>
-    </section>
-  </div>
-  <script>
-      jQuery(function () {
-          SphinxRtdTheme.Navigation.enable(true);
-      });
-  </script> 
-
-</body>
-</html>
\ No newline at end of file
diff --git a/docs/build/html/_modules/aaanalysis/cpp/feature.html b/docs/build/html/_modules/aaanalysis/cpp/feature.html
deleted file mode 100644
index 6fe41a76..00000000
--- a/docs/build/html/_modules/aaanalysis/cpp/feature.html
+++ /dev/null
@@ -1,746 +0,0 @@
-<!DOCTYPE html>
-<html class="writer-html5" lang="en" >
-<head>
-  <meta charset="utf-8" />
-  <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-  <title>aaanalysis.cpp.feature &mdash; AAanalysis</title>
-      <link rel="stylesheet" href="../../../_static/pygments.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/css/theme.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/copybutton.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/plot_directive.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/css/style.css" type="text/css" />
-    <link rel="shortcut icon" href="../../../_static/logo_small.png"/>
-  <!--[if lt IE 9]>
-    <script src="../../../_static/js/html5shiv.min.js"></script>
-  <![endif]-->
-  
-        <script data-url_root="../../../" id="documentation_options" src="../../../_static/documentation_options.js"></script>
-        <script src="../../../_static/jquery.js"></script>
-        <script src="../../../_static/underscore.js"></script>
-        <script src="../../../_static/_sphinx_javascript_frameworks_compat.js"></script>
-        <script src="../../../_static/doctools.js"></script>
-        <script src="../../../_static/sphinx_highlight.js"></script>
-        <script src="../../../_static/clipboard.min.js"></script>
-        <script src="../../../_static/copybutton.js"></script>
-        <script src="../../../_static/design-tabs.js"></script>
-    <script src="../../../_static/js/theme.js"></script>
-    <link rel="index" title="Index" href="../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../search.html" /> 
-</head>
-
-<body class="wy-body-for-nav"> 
-  <div class="wy-grid-for-nav">
-    <nav data-toggle="wy-nav-shift" class="wy-nav-side">
-      <div class="wy-side-scroll">
-        <div class="wy-side-nav-search"  style="background: #343131" >
-            <a href="../../../index.html">
-            <img src="../../../_static/logo_big_trans.png" class="logo" alt="Logo"/>
-          </a>
-              <div class="version">
-                latest
-              </div>
-<div role="search">
-  <form id="rtd-search-form" class="wy-form" action="../../../search.html" method="get">
-    <input type="text" name="q" placeholder="Search docs" />
-    <input type="hidden" name="check_keywords" value="yes" />
-    <input type="hidden" name="area" value="default" />
-  </form>
-</div>
-        </div><div class="wy-menu wy-menu-vertical" data-spy="affix" role="navigation" aria-label="Navigation menu">
-              <p class="caption" role="heading"><span class="caption-text">OVERVIEW</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/introduction.html">Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/usage_principles.html">Usage Principles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/CONTRIBUTING_COPY.html">Contributing</a></li>
-</ul>
-<p class="caption" role="heading"><span class="caption-text">EXAMPLES</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../tutorials.html">Tutorials</a></li>
-</ul>
-<p class="caption" role="heading"><span class="caption-text">REFERENCES</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../api.html">API</a></li>
-</ul>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../_index/tables.html">Tables</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/references.html">References</a></li>
-</ul>
-
-        </div>
-      </div>
-    </nav>
-
-    <section data-toggle="wy-nav-shift" class="wy-nav-content-wrap"><nav class="wy-nav-top" aria-label="Mobile navigation menu"  style="background: #343131" >
-          <i data-toggle="wy-nav-top" class="fa fa-bars"></i>
-          <a href="../../../index.html">AAanalysis</a>
-      </nav>
-
-      <div class="wy-nav-content">
-        <div class="rst-content">
-          <div role="navigation" aria-label="Page navigation">
-  <ul class="wy-breadcrumbs">
-      <li><a href="../../../index.html" class="icon icon-home"></a></li>
-          <li class="breadcrumb-item"><a href="../../index.html">Module code</a></li>
-      <li class="breadcrumb-item active">aaanalysis.cpp.feature</li>
-      <li class="wy-breadcrumbs-aside">
-      </li>
-  </ul>
-  <hr/>
-</div>
-          <div role="main" class="document" itemscope="itemscope" itemtype="http://schema.org/Article">
-           <div itemprop="articleBody">
-             
-  <h1>Source code for aaanalysis.cpp.feature</h1><div class="highlight"><pre>
-<span></span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">Script for SequenceFeature() object that combines scales, splits, and parts to create</span>
-<span class="sd">    feature names, feature values, or a feature matrix for ML or CPP pipelines.</span>
-<span class="sd">&quot;&quot;&quot;</span>
-<span class="kn">import</span> <span class="nn">os</span>
-<span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
-<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-<span class="kn">import</span> <span class="nn">math</span>
-<span class="kn">from</span> <span class="nn">itertools</span> <span class="kn">import</span> <span class="n">repeat</span>
-<span class="kn">import</span> <span class="nn">multiprocessing</span> <span class="k">as</span> <span class="nn">mp</span>
-<span class="kn">import</span> <span class="nn">warnings</span>
-
-<span class="kn">from</span> <span class="nn">aaanalysis.cpp._feature_pos</span> <span class="kn">import</span> <span class="n">SequenceFeaturePositions</span>
-<span class="kn">from</span> <span class="nn">aaanalysis.cpp._split</span> <span class="kn">import</span> <span class="n">Split</span><span class="p">,</span> <span class="n">SplitRange</span>
-<span class="kn">from</span> <span class="nn">aaanalysis.cpp._part</span> <span class="kn">import</span> <span class="n">Parts</span>
-
-<span class="kn">import</span> <span class="nn">aaanalysis</span> <span class="k">as</span> <span class="nn">aa</span>
-<span class="kn">import</span> <span class="nn">aaanalysis.utils</span> <span class="k">as</span> <span class="nn">ut</span>
-
-<span class="c1"># TODO simplify and check</span>
-
-
-<span class="c1"># I Helper Functions</span>
-<span class="c1"># Check for add methods</span>
-<span class="k">def</span> <span class="nf">check_ref_group</span><span class="p">(</span><span class="n">ref_group</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check if ref group class lable&quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="n">ref_group</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;&#39;ref_group&#39; (</span><span class="si">{</span><span class="n">ref_group</span><span class="si">}</span><span class="s2">) not class label: </span><span class="si">{</span><span class="nb">set</span><span class="p">(</span><span class="n">labels</span><span class="p">)</span><span class="si">}</span><span class="s2">.&quot;</span><span class="p">)</span>
-
-
-<span class="k">def</span> <span class="nf">check_sample_in_df_seq</span><span class="p">(</span><span class="n">sample_name</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">df_seq</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check if sample name in df_seq&quot;&quot;&quot;</span>
-    <span class="n">list_names</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">df_seq</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_NAME</span><span class="p">])</span>
-    <span class="k">if</span> <span class="n">sample_name</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">list_names</span><span class="p">:</span>
-        <span class="n">error</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;&#39;sample_name&#39; (&#39;</span><span class="si">{</span><span class="n">sample_name</span><span class="si">}</span><span class="s2">&#39;) not in &#39;</span><span class="si">{</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_NAME</span><span class="si">}</span><span class="s2">&#39; of &#39;df_seq&#39;.&quot;</span> \
-                <span class="sa">f</span><span class="s2">&quot;</span><span class="se">\n</span><span class="s2">Valid names are: </span><span class="si">{</span><span class="n">list_names</span><span class="si">}</span><span class="s2">&quot;</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">error</span><span class="p">)</span>
-
-
-<span class="c1"># Check load functions</span>
-<span class="k">def</span> <span class="nf">check_clustered</span><span class="p">(</span><span class="n">complete</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">clust_th</span><span class="o">=</span><span class="mf">0.7</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check input for loading functions&quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="ow">not</span> <span class="n">complete</span> <span class="ow">and</span> <span class="n">clust_th</span> <span class="ow">not</span> <span class="ow">in</span> <span class="p">[</span><span class="mf">0.9</span><span class="p">,</span> <span class="mf">0.7</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.3</span><span class="p">]:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;&#39;clust_th&#39; should be 0.3, 0.5, 0.7, or 0.9&quot;</span><span class="p">)</span>
-
-
-<span class="c1"># Check functions get_split_kws</span>
-<span class="k">def</span> <span class="nf">check_split_types</span><span class="p">(</span><span class="n">split_types</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check split_type&quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">split_types</span><span class="p">)</span> <span class="ow">is</span> <span class="nb">str</span><span class="p">:</span>
-        <span class="n">split_types</span> <span class="o">=</span> <span class="p">[</span><span class="n">split_types</span><span class="p">]</span>
-    <span class="n">list_split_types</span> <span class="o">=</span> <span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">STR_SEGMENT</span><span class="p">,</span> <span class="n">ut</span><span class="o">.</span><span class="n">STR_PATTERN</span><span class="p">,</span> <span class="n">ut</span><span class="o">.</span><span class="n">STR_PERIODIC_PATTERN</span><span class="p">]</span>
-    <span class="k">if</span> <span class="n">split_types</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">split_types</span> <span class="o">=</span> <span class="n">list_split_types</span>
-    <span class="k">if</span> <span class="ow">not</span> <span class="nb">set</span><span class="p">(</span><span class="n">list_split_types</span><span class="p">)</span><span class="o">.</span><span class="n">issuperset</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">split_types</span><span class="p">)):</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;&#39;split_types&#39;(</span><span class="si">{</span><span class="n">split_types</span><span class="si">}</span><span class="s2">) must be in </span><span class="si">{</span><span class="n">list_split_types</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">split_types</span>
-
-
-<span class="k">def</span> <span class="nf">check_split_int_args</span><span class="p">(</span><span class="n">kwargs_int</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check type of given arguments&quot;&quot;&quot;</span>
-    <span class="k">for</span> <span class="n">arg</span> <span class="ow">in</span> <span class="n">kwargs_int</span><span class="p">:</span>
-        <span class="n">arg_val</span> <span class="o">=</span> <span class="n">kwargs_int</span><span class="p">[</span><span class="n">arg</span><span class="p">]</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="n">arg</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">arg_val</span><span class="p">)</span>
-
-
-<span class="k">def</span> <span class="nf">check_split_list_args</span><span class="p">(</span><span class="n">kwargs_list</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check type of given arguments&quot;&quot;&quot;</span>
-    <span class="k">for</span> <span class="n">arg</span> <span class="ow">in</span> <span class="n">kwargs_list</span><span class="p">:</span>
-        <span class="n">arg_val</span> <span class="o">=</span> <span class="n">kwargs_list</span><span class="p">[</span><span class="n">arg</span><span class="p">]</span>
-        <span class="k">if</span> <span class="ow">not</span> <span class="p">(</span><span class="n">accept_none</span> <span class="ow">and</span> <span class="n">arg_val</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">):</span>
-            <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">arg_val</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">list</span><span class="p">:</span>
-                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;&#39;</span><span class="si">{</span><span class="n">arg</span><span class="si">}</span><span class="s2">&#39; (</span><span class="si">{</span><span class="n">arg_val</span><span class="si">}</span><span class="s2">) should be list with non-negative integers&quot;</span><span class="p">)</span>
-            <span class="k">else</span><span class="p">:</span>
-                <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">arg_val</span><span class="p">:</span>
-                    <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">i</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">int</span> <span class="ow">or</span> <span class="n">i</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">:</span>
-                        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Elements in &#39;</span><span class="si">{</span><span class="n">arg</span><span class="si">}</span><span class="s2">&#39; (</span><span class="si">{</span><span class="n">arg_val</span><span class="si">}</span><span class="s2">) should be non-negative integer&quot;</span><span class="p">)</span>
-
-
-<span class="c1"># Check functions feature values</span>
-<span class="k">def</span> <span class="nf">_get_missing_elements</span><span class="p">(</span><span class="n">df_parts</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">scale_elements</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">accept_gaps</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Get missing elements&quot;&quot;&quot;</span>
-    <span class="n">seq_elements</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="s2">&quot;&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">df_parts</span><span class="o">.</span><span class="n">values</span><span class="o">.</span><span class="n">flatten</span><span class="p">()))</span>
-    <span class="k">if</span> <span class="n">accept_gaps</span><span class="p">:</span>
-        <span class="n">missing_elements</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">seq_elements</span> <span class="k">if</span> <span class="n">x</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">scale_elements</span> <span class="ow">and</span> <span class="n">x</span> <span class="o">!=</span> <span class="n">ut</span><span class="o">.</span><span class="n">STR_AA_GAP</span><span class="p">]</span>
-    <span class="k">else</span><span class="p">:</span>
-        <span class="n">missing_elements</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">seq_elements</span> <span class="k">if</span> <span class="n">x</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">scale_elements</span><span class="p">]</span>
-    <span class="k">return</span> <span class="n">missing_elements</span>
-
-
-<span class="k">def</span> <span class="nf">check_dict_scale</span><span class="p">(</span><span class="n">dict_scale</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">df_parts</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">accept_gaps</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check if dict_scale is dictionary with numerical values&quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">dict_scale</span><span class="p">,</span> <span class="nb">dict</span><span class="p">):</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;&#39;dict_scale&#39; must be a dictionary with values of type float or int&quot;</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">accept_gaps</span><span class="p">:</span>
-        <span class="n">f</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">key</span><span class="p">:</span> <span class="nb">type</span><span class="p">(</span><span class="n">dict_scale</span><span class="p">[</span><span class="n">key</span><span class="p">])</span> <span class="ow">not</span> <span class="ow">in</span> <span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">]</span>
-    <span class="k">else</span><span class="p">:</span>
-        <span class="n">f</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">key</span><span class="p">:</span> <span class="nb">type</span><span class="p">(</span><span class="n">dict_scale</span><span class="p">[</span><span class="n">key</span><span class="p">])</span> <span class="ow">not</span> <span class="ow">in</span> <span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">]</span> <span class="ow">or</span> <span class="n">math</span><span class="o">.</span><span class="n">isnan</span><span class="p">(</span><span class="n">dict_scale</span><span class="p">[</span><span class="n">key</span><span class="p">])</span>
-    <span class="n">wrong_type</span> <span class="o">=</span> <span class="p">[(</span><span class="n">key</span><span class="p">,</span> <span class="n">dict_scale</span><span class="p">[</span><span class="n">key</span><span class="p">])</span> <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">dict_scale</span> <span class="k">if</span> <span class="n">f</span><span class="p">(</span><span class="n">key</span><span class="p">)]</span>
-    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">wrong_type</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-        <span class="n">error</span> <span class="o">=</span> <span class="s2">&quot;&#39;dict_scale&#39; must be a dictionary with values of type float or int.&quot;</span> \
-                <span class="s2">&quot;</span><span class="se">\n</span><span class="s2"> Following key-value pairs are not accepted: </span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">wrong_type</span><span class="p">)</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">error</span><span class="p">)</span>
-    <span class="c1"># Check matching of scale to sequences of df_parts</span>
-    <span class="n">args</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">df_parts</span><span class="o">=</span><span class="n">df_parts</span><span class="p">,</span> <span class="n">scale_elements</span><span class="o">=</span><span class="nb">list</span><span class="p">(</span><span class="n">dict_scale</span><span class="o">.</span><span class="n">keys</span><span class="p">()),</span> <span class="n">accept_gaps</span><span class="o">=</span><span class="n">accept_gaps</span><span class="p">)</span>
-    <span class="n">missing_elements</span> <span class="o">=</span> <span class="n">_get_missing_elements</span><span class="p">(</span><span class="o">**</span><span class="n">args</span><span class="p">)</span>
-    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">missing_elements</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Scale does not match for following sequence element: </span><span class="si">{</span><span class="n">missing_elements</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-
-
-<span class="c1"># Check functions feature matrix</span>
-<span class="k">def</span> <span class="nf">check_df_scales_matches_df_parts</span><span class="p">(</span><span class="n">df_scales</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">df_parts</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">accept_gaps</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check if df_scales has values for all Letters in sequences from df_parts&quot;&quot;&quot;</span>
-    <span class="n">args</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">df_parts</span><span class="o">=</span><span class="n">df_parts</span><span class="p">,</span> <span class="n">scale_elements</span><span class="o">=</span><span class="nb">list</span><span class="p">(</span><span class="n">df_scales</span><span class="o">.</span><span class="n">index</span><span class="p">),</span> <span class="n">accept_gaps</span><span class="o">=</span><span class="n">accept_gaps</span><span class="p">)</span>
-    <span class="n">missing_elements</span> <span class="o">=</span> <span class="n">_get_missing_elements</span><span class="p">(</span><span class="o">**</span><span class="n">args</span><span class="p">)</span>
-    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">missing_elements</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Scale does not match for following sequence element: </span><span class="si">{</span><span class="n">missing_elements</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-
-
-<span class="k">def</span> <span class="nf">check_parts_in_df_parts</span><span class="p">(</span><span class="n">df_parts</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">part</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Check if part in df_parts&quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="n">part</span><span class="o">.</span><span class="n">lower</span><span class="p">()</span> <span class="ow">not</span> <span class="ow">in</span> <span class="nb">list</span><span class="p">(</span><span class="n">df_parts</span><span class="p">):</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;&#39;part&#39; (</span><span class="si">{}</span><span class="s2">) must be in columns of &#39;df_parts&#39;: </span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">part</span><span class="p">,</span> <span class="nb">list</span><span class="p">(</span><span class="n">df_parts</span><span class="p">)))</span>
-
-
-<span class="c1"># Functions to create feature (part + split + scale)</span>
-<span class="k">def</span> <span class="nf">_get_feature_components</span><span class="p">(</span><span class="n">feat_name</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">dict_all_scales</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Convert feature name into three feature components of part, split, and scale given as dictionary&quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="n">feat_name</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">or</span> <span class="n">dict_all_scales</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;&#39;feature_name&#39; and &#39;dict_all_scales&#39; must be given&quot;</span><span class="p">)</span>
-    <span class="n">part</span><span class="p">,</span> <span class="n">split</span><span class="p">,</span> <span class="n">scale</span> <span class="o">=</span> <span class="n">feat_name</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;-&quot;</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">scale</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">dict_all_scales</span><span class="p">:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;&#39;scale&#39; from &#39;feature_name&#39; is not in &#39;dict_all_scales&quot;</span><span class="p">)</span>
-    <span class="n">dict_scale</span> <span class="o">=</span> <span class="n">dict_all_scales</span><span class="p">[</span><span class="n">scale</span><span class="p">]</span>
-    <span class="k">return</span> <span class="n">part</span><span class="p">,</span> <span class="n">split</span><span class="p">,</span> <span class="n">dict_scale</span>
-
-
-<span class="k">def</span> <span class="nf">_feature_value</span><span class="p">(</span><span class="n">df_parts</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">split</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">dict_scale</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">accept_gaps</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Helper function to create feature values for feature matrix&quot;&quot;&quot;</span>
-    <span class="n">sp</span> <span class="o">=</span> <span class="n">Split</span><span class="p">()</span>
-    <span class="c1"># Get vectorized split function</span>
-    <span class="n">split_type</span><span class="p">,</span> <span class="n">split_kwargs</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_split</span><span class="p">(</span><span class="n">split</span><span class="o">=</span><span class="n">split</span><span class="p">)</span>
-    <span class="n">f_split</span> <span class="o">=</span> <span class="nb">getattr</span><span class="p">(</span><span class="n">sp</span><span class="p">,</span> <span class="n">split_type</span><span class="o">.</span><span class="n">lower</span><span class="p">())</span>
-    <span class="c1"># Vectorize split function using anonymous function</span>
-    <span class="n">vf_split</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">vectorize</span><span class="p">(</span><span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">f_split</span><span class="p">(</span><span class="n">seq</span><span class="o">=</span><span class="n">x</span><span class="p">,</span> <span class="o">**</span><span class="n">split_kwargs</span><span class="p">))</span>
-    <span class="c1"># Get vectorized scale function</span>
-    <span class="n">vf_scale</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">get_vf_scale</span><span class="p">(</span><span class="n">dict_scale</span><span class="o">=</span><span class="n">dict_scale</span><span class="p">,</span> <span class="n">accept_gaps</span><span class="o">=</span><span class="n">accept_gaps</span><span class="p">)</span>
-    <span class="c1"># Combine part split and scale to get feature values</span>
-    <span class="n">part_split</span> <span class="o">=</span> <span class="n">vf_split</span><span class="p">(</span><span class="n">df_parts</span><span class="p">)</span>
-    <span class="n">feature_value</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">round</span><span class="p">(</span><span class="n">vf_scale</span><span class="p">(</span><span class="n">part_split</span><span class="p">),</span> <span class="mi">5</span><span class="p">)</span>  <span class="c1"># feature values</span>
-    <span class="k">return</span> <span class="n">feature_value</span>
-
-
-<span class="k">def</span> <span class="nf">_feature_matrix</span><span class="p">(</span><span class="n">feat_names</span><span class="p">,</span> <span class="n">dict_all_scales</span><span class="p">,</span> <span class="n">df_parts</span><span class="p">,</span> <span class="n">accept_gaps</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Helper function to create feature matrix via multiple processing&quot;&quot;&quot;</span>
-    <span class="n">feat_matrix</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">empty</span><span class="p">([</span><span class="nb">len</span><span class="p">(</span><span class="n">df_parts</span><span class="p">),</span> <span class="nb">len</span><span class="p">(</span><span class="n">feat_names</span><span class="p">)])</span>
-    <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">feat_name</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">feat_names</span><span class="p">):</span>
-        <span class="n">part</span><span class="p">,</span> <span class="n">split</span><span class="p">,</span> <span class="n">dict_scale</span> <span class="o">=</span> <span class="n">_get_feature_components</span><span class="p">(</span><span class="n">feat_name</span><span class="o">=</span><span class="n">feat_name</span><span class="p">,</span>
-                                                          <span class="n">dict_all_scales</span><span class="o">=</span><span class="n">dict_all_scales</span><span class="p">)</span>
-        <span class="n">check_parts_in_df_parts</span><span class="p">(</span><span class="n">df_parts</span><span class="o">=</span><span class="n">df_parts</span><span class="p">,</span> <span class="n">part</span><span class="o">=</span><span class="n">part</span><span class="p">)</span>
-        <span class="n">feat_matrix</span><span class="p">[:,</span> <span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">_feature_value</span><span class="p">(</span><span class="n">split</span><span class="o">=</span><span class="n">split</span><span class="p">,</span>
-                                           <span class="n">dict_scale</span><span class="o">=</span><span class="n">dict_scale</span><span class="p">,</span>
-                                           <span class="n">df_parts</span><span class="o">=</span><span class="n">df_parts</span><span class="p">[</span><span class="n">part</span><span class="o">.</span><span class="n">lower</span><span class="p">()],</span>
-                                           <span class="n">accept_gaps</span><span class="o">=</span><span class="n">accept_gaps</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">feat_matrix</span>
-    
-    
-<span class="c1"># II Main Functions</span>
-<div class="viewcode-block" id="SequenceFeature"><a class="viewcode-back" href="../../../generated/aaanalysis.SequenceFeature.html#aaanalysis.SequenceFeature">[docs]</a><span class="k">class</span> <span class="nc">SequenceFeature</span><span class="p">:</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Retrieve and create sequence feature components (Part, Split, and Scale).</span>
-
-<span class="sd">    Notes</span>
-<span class="sd">    -----</span>
-<span class="sd">    Part: Feature Component</span>
-<span class="sd">        A continuous subset of a sequence like a protein domain (e.g, transmembrane domain of membrane proteins).</span>
-
-<span class="sd">    Split: Feature Component</span>
-<span class="sd">        Principle to obtain a distinct subset of amino acids from a sequence part like a segment or a pattern.</span>
-
-<span class="sd">    Scale: Feature Component</span>
-<span class="sd">        A physicochemical scale assigning  each amino acid a numerical value between 0 and 1.</span>
-
-<span class="sd">    Feature: Part + Split + Scale</span>
-<span class="sd">        Physicochemical property (expressed as numerical scale) present at distinct amino acid</span>
-<span class="sd">        positions within a protein sequence. The positions are obtained by splitting sequence parts</span>
-<span class="sd">        into segments or patterns.</span>
-
-<span class="sd">    Feature value: Realization of a Feature</span>
-<span class="sd">        For a given sequence, a feature value is the average of a physicochemical scale over</span>
-<span class="sd">        all amino acids obtained by splitting a sequence part.</span>
-
-<span class="sd">    List of valid sequence parts:</span>
-<span class="sd">        [&#39;tmd&#39;, &#39;tmd_e&#39;, &#39;tmd_n&#39;, &#39;tmd_c&#39;, &#39;jmd_n&#39;, &#39;jmd_c&#39;, &#39;ext_c&#39;, &#39;ext_n&#39;,</span>
-<span class="sd">        &#39;tmd_jmd&#39;, &#39;jmd_n_tmd_n&#39;, &#39;tmd_c_jmd_c&#39;, &#39;ext_n_tmd_n&#39;, &#39;tmd_c_ext_c&#39;]</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-
-    <span class="c1"># Basic datastructures for features</span>
-<div class="viewcode-block" id="SequenceFeature.get_df_parts"><a class="viewcode-back" href="../../../generated/aaanalysis.SequenceFeature.html#aaanalysis.SequenceFeature.get_df_parts">[docs]</a>    <span class="nd">@staticmethod</span>
-    <span class="k">def</span> <span class="nf">get_df_parts</span><span class="p">(</span><span class="n">df_seq</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">list_parts</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">jmd_n_len</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">ext_len</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span> <span class="n">all_parts</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;Create DataFrane with sequence parts.</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        df_seq: :class:`pandas.DataFrame`</span>
-<span class="sd">            DataFrame with sequence information comprising either sequence (&#39;sequence&#39;, &#39;tmd_start&#39;, &#39;tmd_stop&#39;)</span>
-<span class="sd">            or sequence part (&#39;jmd_n&#39;, &#39;tmd&#39;, &#39;jmd_c&#39;) columns.</span>
-<span class="sd">        list_parts: list of string, len&gt;=1</span>
-<span class="sd">            Names of sequence parts which should be created (e.g., &#39;tmd&#39;).</span>
-<span class="sd">        jmd_n_len: int, default = None, optional</span>
-<span class="sd">            Length of JMD-N in number of amino acids. If None, &#39;jmd_n&#39; column must be given in df_seq.</span>
-<span class="sd">        jmd_c_len: int, default = None, optional</span>
-<span class="sd">            Length of JMD-N in number of amino acids. If None, &#39;jmd_c&#39; column must be given in df_seq.</span>
-<span class="sd">        ext_len: int, default = 4</span>
-<span class="sd">            Lenght of N- resp. C-terminal extra part of TMD.</span>
-<span class="sd">        all_parts: bool, default = False</span>
-<span class="sd">            Whether to create DataFrame with all possible sequence parts (if True) or parts given by list_parts.</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        df_parts: :class:`pandas.DataFrame`</span>
-<span class="sd">            DataFrame with sequence parts.</span>
-
-<span class="sd">        Notes</span>
-<span class="sd">        -----</span>
-<span class="sd">        List of valid sequence parts can be found in :class: ´aaanalysis.SequenceFeature´.</span>
-
-<span class="sd">        Examples</span>
-<span class="sd">        --------</span>
-<span class="sd">        Get sequence parts based on parts columns in df_seq with with &#39;tmd_e&#39;, and &#39;tmd_jmd&#39; as parts:</span>
-
-<span class="sd">        &gt;&gt;&gt; import aaanalysis as aa</span>
-<span class="sd">        &gt;&gt;&gt; sf = aa.SequenceFeature()</span>
-<span class="sd">        &gt;&gt;&gt; df_seq = aa.load_dataset(name=&#39;GSEC_SUB_SEQ&#39;)</span>
-<span class="sd">        &gt;&gt;&gt; df_parts = sf.get_df_parts(df_seq=df_seq, list_parts=[&quot;tmd_e&quot;, &quot;tmd_jmd&quot;])</span>
-
-<span class="sd">        Get sequence parts based on sequence column in df_seq and jmd_n_len and jmd_c_len with default parts:</span>
-
-<span class="sd">        &gt;&gt;&gt; import aaanalysis as aa</span>
-<span class="sd">        &gt;&gt;&gt; sf = aa.SequenceFeature()</span>
-<span class="sd">        &gt;&gt;&gt; df_seq = aa.load_dataset(name=&#39;GSEC_SUB_SEQ&#39;)</span>
-<span class="sd">        &gt;&gt;&gt; df_parts = sf.get_df_parts(df_seq=df_seq, jmd_n_len=10, jmd_c_len=10)</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_args_len</span><span class="p">(</span><span class="n">jmd_n_len</span><span class="o">=</span><span class="n">jmd_n_len</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="n">jmd_c_len</span><span class="p">,</span> <span class="n">ext_len</span><span class="o">=</span><span class="n">ext_len</span><span class="p">,</span> <span class="n">accept_tmd_none</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-        <span class="n">df_seq</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_df_seq</span><span class="p">(</span><span class="n">df_seq</span><span class="o">=</span><span class="n">df_seq</span><span class="p">,</span> <span class="n">jmd_n_len</span><span class="o">=</span><span class="n">jmd_n_len</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="n">jmd_c_len</span><span class="p">)</span>
-        <span class="n">list_parts</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_list_parts</span><span class="p">(</span><span class="n">list_parts</span><span class="o">=</span><span class="n">list_parts</span><span class="p">,</span> <span class="n">all_parts</span><span class="o">=</span><span class="n">all_parts</span><span class="p">)</span>
-        <span class="n">seq_info_in_df</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">ut</span><span class="o">.</span><span class="n">COLS_SEQ_INFO</span><span class="p">)</span><span class="o">.</span><span class="n">issubset</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">df_seq</span><span class="p">))</span>
-        <span class="n">pa</span> <span class="o">=</span> <span class="n">Parts</span><span class="p">()</span>
-        <span class="n">dict_parts</span> <span class="o">=</span> <span class="p">{}</span>
-        <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">row</span> <span class="ow">in</span> <span class="n">df_seq</span><span class="o">.</span><span class="n">iterrows</span><span class="p">():</span>
-            <span class="n">entry</span> <span class="o">=</span> <span class="n">row</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_ENTRY</span><span class="p">]</span>
-            <span class="k">if</span> <span class="n">jmd_c_len</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">jmd_n_len</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">seq_info_in_df</span><span class="p">:</span>
-                <span class="n">seq</span><span class="p">,</span> <span class="n">start</span><span class="p">,</span> <span class="n">stop</span> <span class="o">=</span> <span class="n">row</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COLS_SEQ_INFO</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
-                <span class="n">parts</span> <span class="o">=</span> <span class="n">pa</span><span class="o">.</span><span class="n">create_parts</span><span class="p">(</span><span class="n">seq</span><span class="o">=</span><span class="n">seq</span><span class="p">,</span> <span class="n">tmd_start</span><span class="o">=</span><span class="n">start</span><span class="p">,</span> <span class="n">tmd_stop</span><span class="o">=</span><span class="n">stop</span><span class="p">,</span>
-                                        <span class="n">jmd_n_len</span><span class="o">=</span><span class="n">jmd_n_len</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="n">jmd_c_len</span><span class="p">)</span>
-                <span class="n">jmd_n</span><span class="p">,</span> <span class="n">tmd</span><span class="p">,</span> <span class="n">jmd_c</span> <span class="o">=</span> <span class="n">parts</span><span class="o">.</span><span class="n">jmd_n</span><span class="p">,</span> <span class="n">parts</span><span class="o">.</span><span class="n">tmd</span><span class="p">,</span> <span class="n">parts</span><span class="o">.</span><span class="n">jmd_c</span>
-            <span class="k">else</span><span class="p">:</span>
-                <span class="n">jmd_n</span><span class="p">,</span> <span class="n">tmd</span><span class="p">,</span> <span class="n">jmd_c</span> <span class="o">=</span> <span class="n">row</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COLS_PARTS</span><span class="p">]</span><span class="o">.</span><span class="n">values</span>
-            <span class="n">dict_part_seq</span> <span class="o">=</span> <span class="n">pa</span><span class="o">.</span><span class="n">get_dict_part_seq</span><span class="p">(</span><span class="n">tmd</span><span class="o">=</span><span class="n">tmd</span><span class="p">,</span> <span class="n">jmd_n</span><span class="o">=</span><span class="n">jmd_n</span><span class="p">,</span> <span class="n">jmd_c</span><span class="o">=</span><span class="n">jmd_c</span><span class="p">,</span> <span class="n">ext_len</span><span class="o">=</span><span class="n">ext_len</span><span class="p">)</span>
-            <span class="n">dict_part_seq</span> <span class="o">=</span> <span class="p">{</span><span class="n">part</span><span class="p">:</span> <span class="n">dict_part_seq</span><span class="p">[</span><span class="n">part</span><span class="p">]</span> <span class="k">for</span> <span class="n">part</span> <span class="ow">in</span> <span class="n">list_parts</span><span class="p">}</span>
-            <span class="n">dict_parts</span><span class="p">[</span><span class="n">entry</span><span class="p">]</span> <span class="o">=</span> <span class="n">dict_part_seq</span>
-        <span class="n">df_parts</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="o">.</span><span class="n">from_dict</span><span class="p">(</span><span class="n">dict_parts</span><span class="p">,</span> <span class="n">orient</span><span class="o">=</span><span class="s2">&quot;index&quot;</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">df_parts</span></div>
-
-<div class="viewcode-block" id="SequenceFeature.get_split_kws"><a class="viewcode-back" href="../../../generated/aaanalysis.SequenceFeature.html#aaanalysis.SequenceFeature.get_split_kws">[docs]</a>    <span class="nd">@staticmethod</span>
-    <span class="k">def</span> <span class="nf">get_split_kws</span><span class="p">(</span><span class="n">n_split_min</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">n_split_max</span><span class="o">=</span><span class="mi">15</span><span class="p">,</span> <span class="n">steps_pattern</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">n_min</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span> <span class="n">n_max</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span> <span class="n">len_max</span><span class="o">=</span><span class="mi">15</span><span class="p">,</span>
-                      <span class="n">steps_periodicpattern</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">split_types</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;Create dictionary with kwargs for three split types: Segment, Pattern, PeriodicPattern</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        n_split_min: int, default = 1</span>
-<span class="sd">            Number greater 0 to specify the greatest Segment (e.g., 1/1 TMD alias whole TMD sequence).</span>
-<span class="sd">        n_split_max: int, default = 15,</span>
-<span class="sd">            Number greater n_split_min to specfiy the smallest Segment (e.g., 1/15 TMD).</span>
-<span class="sd">        steps_pattern: list of integers, default = [3, 4, 6, 7, 8]</span>
-<span class="sd">            Possible steps sizes for Pattern.</span>
-<span class="sd">        n_min: int, default = 2</span>
-<span class="sd">            Minimum number of steps for Pattern.</span>
-<span class="sd">        n_max: int, default = 4</span>
-<span class="sd">            Maximum number of steps for Pattern.</span>
-<span class="sd">        len_max: int, default = 10</span>
-<span class="sd">            Maximum length in amino acid position for Pattern by varying start position.</span>
-<span class="sd">        steps_periodicpattern: list of integers, default = [3, 4]</span>
-<span class="sd">            Step sizes for PeriodicPattern.</span>
-<span class="sd">        split_types: list of strings, default = [&quot;Segment&quot;, &quot;Pattern&quot; &quot;PeriodicPattern&quot;]</span>
-<span class="sd">            Split types for which paramter dictionary should be generated.</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        split_kws: dict</span>
-<span class="sd">            Nested dictionary with parameters for chosen split_types:</span>
-
-<span class="sd">            a) Segment: {n_split_min:1, n_split_max=15}</span>
-<span class="sd">            b) Pattern: {steps=[3, 4], n_min=2, n_max=4, len_max=15}</span>
-<span class="sd">            c) PeriodicPattern: {steps=[3, 4]}</span>
-
-<span class="sd">        Examples</span>
-<span class="sd">        --------</span>
-<span class="sd">        Get default arguments for all splits types (Segment, Pattern, PeriodicPattern):</span>
-
-<span class="sd">        &gt;&gt;&gt; import aaanalysis as aa</span>
-<span class="sd">        &gt;&gt;&gt; sf = aa.SequenceFeature()</span>
-<span class="sd">        &gt;&gt;&gt; split_kws = sf.get_split_kws()</span>
-
-<span class="sd">        Get default argumetns for Segment split:</span>
-
-<span class="sd">        &gt;&gt;&gt; import aaanalysis as aa</span>
-<span class="sd">        &gt;&gt;&gt; sf = aa.SequenceFeature()</span>
-<span class="sd">        &gt;&gt;&gt; split_kws = sf.get_split_kws(split_types=&quot;Segment&quot;)</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="n">split_types</span> <span class="o">=</span> <span class="n">check_split_types</span><span class="p">(</span><span class="n">split_types</span><span class="o">=</span><span class="n">split_types</span><span class="p">)</span>
-        <span class="n">args_int</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">n_split_min</span><span class="o">=</span><span class="n">n_split_min</span><span class="p">,</span> <span class="n">n_split_max</span><span class="o">=</span><span class="n">n_split_max</span><span class="p">,</span> <span class="n">n_min</span><span class="o">=</span><span class="n">n_min</span><span class="p">,</span> <span class="n">n_max</span><span class="o">=</span><span class="n">n_max</span><span class="p">,</span> <span class="n">len_max</span><span class="o">=</span><span class="n">len_max</span><span class="p">)</span>
-        <span class="n">check_split_int_args</span><span class="p">(</span><span class="n">kwargs_int</span><span class="o">=</span><span class="n">args_int</span><span class="p">)</span>
-        <span class="n">args_list</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">steps_pattern</span><span class="o">=</span><span class="n">steps_pattern</span><span class="p">,</span> <span class="n">steps_periodicpattern</span><span class="o">=</span><span class="n">steps_periodicpattern</span><span class="p">)</span>
-        <span class="n">check_split_list_args</span><span class="p">(</span><span class="n">kwargs_list</span><span class="o">=</span><span class="n">args_list</span><span class="p">)</span>
-        <span class="k">if</span> <span class="n">steps_pattern</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="c1"># Differences between interacting amino acids in helix (without gaps) include 6, 7 ,8 to include gaps</span>
-            <span class="n">steps_pattern</span> <span class="o">=</span> <span class="p">[</span><span class="mi">3</span><span class="p">,</span> <span class="mi">4</span><span class="p">]</span>
-        <span class="k">if</span> <span class="n">steps_periodicpattern</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">steps_periodicpattern</span> <span class="o">=</span> <span class="p">[</span><span class="mi">3</span><span class="p">,</span> <span class="mi">4</span><span class="p">]</span>      <span class="c1"># Differences between interacting amino acids in helix (without gaps)</span>
-        <span class="n">split_kws</span> <span class="o">=</span> <span class="p">{</span><span class="n">ut</span><span class="o">.</span><span class="n">STR_SEGMENT</span><span class="p">:</span> <span class="nb">dict</span><span class="p">(</span><span class="n">n_split_min</span><span class="o">=</span><span class="n">n_split_min</span><span class="p">,</span> <span class="n">n_split_max</span><span class="o">=</span><span class="n">n_split_max</span><span class="p">),</span>
-                     <span class="n">ut</span><span class="o">.</span><span class="n">STR_PATTERN</span><span class="p">:</span> <span class="nb">dict</span><span class="p">(</span><span class="n">steps</span><span class="o">=</span><span class="n">steps_pattern</span><span class="p">,</span> <span class="n">n_min</span><span class="o">=</span><span class="n">n_min</span><span class="p">,</span> <span class="n">n_max</span><span class="o">=</span><span class="n">n_max</span><span class="p">,</span> <span class="n">len_max</span><span class="o">=</span><span class="n">len_max</span><span class="p">),</span>
-                     <span class="n">ut</span><span class="o">.</span><span class="n">STR_PERIODIC_PATTERN</span><span class="p">:</span> <span class="nb">dict</span><span class="p">(</span><span class="n">steps</span><span class="o">=</span><span class="n">steps_periodicpattern</span><span class="p">)}</span>
-        <span class="n">split_kws</span> <span class="o">=</span> <span class="p">{</span><span class="n">x</span><span class="p">:</span> <span class="n">split_kws</span><span class="p">[</span><span class="n">x</span><span class="p">]</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">split_types</span><span class="p">}</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_split_kws</span><span class="p">(</span><span class="n">split_kws</span><span class="o">=</span><span class="n">split_kws</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">split_kws</span></div>
-
-<div class="viewcode-block" id="SequenceFeature.get_features"><a class="viewcode-back" href="../../../generated/aaanalysis.SequenceFeature.html#aaanalysis.SequenceFeature.get_features">[docs]</a>    <span class="k">def</span> <span class="nf">get_features</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">list_parts</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">split_kws</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">df_scales</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">all_parts</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;Create list of all feature ids for given Parts, Splits, and Scales</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        list_parts: list of strings (n&gt;=1 parts), default = [&quot;tmd_e&quot;, &quot;jmd_n_tmd_n&quot;, &quot;tmd_c_jmd_c&quot;]</span>
-<span class="sd">            Names of sequence parts which should be created (e.g., &#39;tmd&#39;).</span>
-<span class="sd">        split_kws: dict, default = SequenceFeature.get_split_kws</span>
-<span class="sd">            Nested dictionary with parameter dictionary for each chosen split_type.</span>
-<span class="sd">        df_scales: :class:`pandas.DataFrame`, default = SequenceFeature.load_scales</span>
-<span class="sd">            DataFrame with default amino acid scales.</span>
-<span class="sd">        all_parts: bool, default = False</span>
-<span class="sd">            Whether to create DataFrame with all possible sequence parts (if True) or parts given by list_parts.</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        features: list of strings</span>
-<span class="sd">            Ids of all possible features for combination of Parts, Splits, and Scales with form: PART-SPLIT-SCALE</span>
-
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="n">list_parts</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_list_parts</span><span class="p">(</span><span class="n">list_parts</span><span class="o">=</span><span class="n">list_parts</span><span class="p">,</span> <span class="n">all_parts</span><span class="o">=</span><span class="n">all_parts</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_split_kws</span><span class="p">(</span><span class="n">split_kws</span><span class="o">=</span><span class="n">split_kws</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_df_scales</span><span class="p">(</span><span class="n">df_scales</span><span class="o">=</span><span class="n">df_scales</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-        <span class="k">if</span> <span class="n">df_scales</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">df_scales</span> <span class="o">=</span> <span class="n">aa</span><span class="o">.</span><span class="n">load_scales</span><span class="p">()</span>
-        <span class="k">if</span> <span class="n">split_kws</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">split_kws</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">get_split_kws</span><span class="p">()</span>
-        <span class="n">scales</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">df_scales</span><span class="p">)</span>
-        <span class="n">spr</span> <span class="o">=</span> <span class="n">SplitRange</span><span class="p">()</span>
-        <span class="n">features</span> <span class="o">=</span> <span class="p">[]</span>
-        <span class="k">for</span> <span class="n">split_type</span> <span class="ow">in</span> <span class="n">split_kws</span><span class="p">:</span>
-            <span class="n">args</span> <span class="o">=</span> <span class="n">split_kws</span><span class="p">[</span><span class="n">split_type</span><span class="p">]</span>
-            <span class="n">labels_s</span> <span class="o">=</span> <span class="nb">getattr</span><span class="p">(</span><span class="n">spr</span><span class="p">,</span> <span class="s2">&quot;labels_&quot;</span> <span class="o">+</span> <span class="n">split_type</span><span class="o">.</span><span class="n">lower</span><span class="p">())(</span><span class="o">**</span><span class="n">args</span><span class="p">)</span>
-            <span class="n">features</span><span class="o">.</span><span class="n">extend</span><span class="p">([</span><span class="s2">&quot;</span><span class="si">{}</span><span class="s2">-</span><span class="si">{}</span><span class="s2">-</span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">p</span><span class="o">.</span><span class="n">upper</span><span class="p">(),</span> <span class="n">s</span><span class="p">,</span> <span class="n">sc</span><span class="p">)</span>
-                             <span class="k">for</span> <span class="n">p</span> <span class="ow">in</span> <span class="n">list_parts</span>
-                             <span class="k">for</span> <span class="n">s</span> <span class="ow">in</span> <span class="n">labels_s</span>
-                             <span class="k">for</span> <span class="n">sc</span> <span class="ow">in</span> <span class="n">scales</span><span class="p">])</span>
-        <span class="k">return</span> <span class="n">features</span></div>
-
-<div class="viewcode-block" id="SequenceFeature.feat_matrix"><a class="viewcode-back" href="../../../generated/aaanalysis.SequenceFeature.html#aaanalysis.SequenceFeature.feat_matrix">[docs]</a>    <span class="nd">@staticmethod</span>
-    <span class="k">def</span> <span class="nf">feat_matrix</span><span class="p">(</span><span class="n">features</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">df_parts</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">df_scales</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">accept_gaps</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-                    <span class="n">n_jobs</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">return_labels</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;Create feature matrix for given feature ids and sequence parts.</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        features: str, list of strings, pd.Series</span>
-<span class="sd">            Ids of features for which matrix of feature values should be created.</span>
-<span class="sd">        df_parts: :class:`pandas.DataFrame`</span>
-<span class="sd">            DataFrame with sequence parts.</span>
-<span class="sd">        df_scales: :class:`pandas.DataFrame`, optional</span>
-<span class="sd">            DataFrame with default amino acid scales.</span>
-<span class="sd">        accept_gaps: bool, default = False</span>
-<span class="sd">            Whether to accept missing values by enabling omitting for computations (if True).</span>
-<span class="sd">        n_jobs: int, default = None,</span>
-<span class="sd">            The number of jobs to run in parallel. If None, it will be set to the maximum.</span>
-<span class="sd">        verbose: bool, default = True</span>
-<span class="sd">            Whether to print size of to be created feature matrix (if True) or not otherwise.</span>
-<span class="sd">        return_labels: bool, default = False</span>
-<span class="sd">            Whether to return sample labels in addition to feature matrix.</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        feat_matrix: array-like or sparse matrix, shape (n_samples, n_features)</span>
-<span class="sd">            Feature values of samples.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;j_jobs&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">n_jobs</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-        <span class="k">if</span> <span class="n">df_scales</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">df_scales</span> <span class="o">=</span> <span class="n">aa</span><span class="o">.</span><span class="n">load_scales</span><span class="p">()</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_df_scales</span><span class="p">(</span><span class="n">df_scales</span><span class="o">=</span><span class="n">df_scales</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_df_parts</span><span class="p">(</span><span class="n">df_parts</span><span class="o">=</span><span class="n">df_parts</span><span class="p">)</span>
-        <span class="n">features</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_features</span><span class="p">(</span><span class="n">features</span><span class="o">=</span><span class="n">features</span><span class="p">,</span> <span class="n">parts</span><span class="o">=</span><span class="n">df_parts</span><span class="p">,</span> <span class="n">df_scales</span><span class="o">=</span><span class="n">df_scales</span><span class="p">)</span>
-        <span class="n">check_df_scales_matches_df_parts</span><span class="p">(</span><span class="n">df_scales</span><span class="o">=</span><span class="n">df_scales</span><span class="p">,</span> <span class="n">df_parts</span><span class="o">=</span><span class="n">df_parts</span><span class="p">,</span> <span class="n">accept_gaps</span><span class="o">=</span><span class="n">accept_gaps</span><span class="p">)</span>
-        <span class="k">if</span> <span class="n">verbose</span><span class="p">:</span>
-            <span class="n">n_feat</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">features</span><span class="p">)</span>
-            <span class="n">n_samples</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">df_parts</span><span class="p">)</span>
-            <span class="n">n_vals</span> <span class="o">=</span> <span class="n">n_feat</span> <span class="o">*</span> <span class="n">n_samples</span>
-            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Feature matrix for </span><span class="si">{</span><span class="n">n_feat</span><span class="si">}</span><span class="s2"> features and </span><span class="si">{</span><span class="n">n_samples</span><span class="si">}</span><span class="s2"> samples will be created&quot;</span><span class="p">)</span>
-            <span class="k">if</span> <span class="n">n_vals</span> <span class="o">&gt;</span> <span class="mi">1000</span><span class="o">*</span><span class="mi">1000</span><span class="p">:</span>
-                <span class="n">warning</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;Feature matrix with n=</span><span class="si">{</span><span class="n">n_vals</span><span class="si">}</span><span class="s2">&gt;=10^6 values will be created, which will take some time.</span><span class="se">\n</span><span class="s2">&quot;</span> \
-                          <span class="s2">&quot;It is recommended to create a feature matrix for a pre-selected number features &quot;</span> \
-                          <span class="s2">&quot;so that 10^6 values are not exceeded.&quot;</span>
-                <span class="n">warnings</span><span class="o">.</span><span class="n">warn</span><span class="p">(</span><span class="n">warning</span><span class="p">)</span>
-        <span class="c1"># Create feature matrix using parallel processing</span>
-        <span class="n">dict_all_scales</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">get_dict_all_scales</span><span class="p">(</span><span class="n">df_scales</span><span class="o">=</span><span class="n">df_scales</span><span class="p">)</span>
-        <span class="n">n_processes</span> <span class="o">=</span> <span class="nb">min</span><span class="p">([</span><span class="n">os</span><span class="o">.</span><span class="n">cpu_count</span><span class="p">(),</span> <span class="nb">len</span><span class="p">(</span><span class="n">features</span><span class="p">)])</span> <span class="k">if</span> <span class="n">n_jobs</span> <span class="ow">is</span> <span class="kc">None</span> <span class="k">else</span> <span class="n">n_jobs</span>
-        <span class="n">feat_chunks</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array_split</span><span class="p">(</span><span class="n">features</span><span class="p">,</span> <span class="n">n_processes</span><span class="p">)</span>
-        <span class="n">args</span> <span class="o">=</span> <span class="nb">zip</span><span class="p">(</span><span class="n">feat_chunks</span><span class="p">,</span> <span class="n">repeat</span><span class="p">(</span><span class="n">dict_all_scales</span><span class="p">),</span> <span class="n">repeat</span><span class="p">(</span><span class="n">df_parts</span><span class="p">),</span> <span class="n">repeat</span><span class="p">(</span><span class="n">accept_gaps</span><span class="p">))</span>
-        <span class="k">with</span> <span class="n">mp</span><span class="o">.</span><span class="n">get_context</span><span class="p">(</span><span class="s2">&quot;spawn&quot;</span><span class="p">)</span><span class="o">.</span><span class="n">Pool</span><span class="p">(</span><span class="n">processes</span><span class="o">=</span><span class="n">n_processes</span><span class="p">)</span> <span class="k">as</span> <span class="n">pool</span><span class="p">:</span>
-            <span class="n">result</span> <span class="o">=</span> <span class="n">pool</span><span class="o">.</span><span class="n">starmap</span><span class="p">(</span><span class="n">_feature_matrix</span><span class="p">,</span> <span class="n">args</span><span class="p">)</span>
-        <span class="n">feat_matrix</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">(</span><span class="n">result</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-        <span class="k">if</span> <span class="n">return_labels</span><span class="p">:</span>
-            <span class="k">if</span> <span class="n">verbose</span><span class="p">:</span>
-                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Tuple of (feat_matrix, labels) will be returned&quot;</span><span class="p">)</span>
-            <span class="n">labels</span> <span class="o">=</span> <span class="n">df_parts</span><span class="o">.</span><span class="n">index</span><span class="o">.</span><span class="n">tolist</span><span class="p">()</span>
-            <span class="k">return</span> <span class="n">feat_matrix</span><span class="p">,</span> <span class="n">labels</span>  <span class="c1"># X, y</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="k">if</span> <span class="n">verbose</span><span class="p">:</span>
-                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Only feat_matrix (without labels) will be returned&quot;</span><span class="p">)</span>
-            <span class="k">return</span> <span class="n">feat_matrix</span>  <span class="c1"># X</span></div>
-
-    <span class="c1"># Additional feature related methods</span>
-<div class="viewcode-block" id="SequenceFeature.feat_names"><a class="viewcode-back" href="../../../generated/aaanalysis.SequenceFeature.html#aaanalysis.SequenceFeature.feat_names">[docs]</a>    <span class="nd">@staticmethod</span>
-    <span class="k">def</span> <span class="nf">feat_names</span><span class="p">(</span><span class="n">features</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">df_cat</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">tmd_len</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">jmd_n_len</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">ext_len</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;Convert feature ids (PART-SPLIT-SCALE) into feature names (scale name [positions]).</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        features: str, list of strings, pd.Series</span>
-<span class="sd">            Ids of features for which feature names should be created.</span>
-<span class="sd">        df_cat: :class:`pandas.DataFrame`, default = SequenceFeature.load_categories</span>
-<span class="sd">            DataFrame with default categories for physicochemical amino acid scales</span>
-<span class="sd">        tmd_len: int, &gt;0</span>
-<span class="sd">            Length of TMD.</span>
-<span class="sd">        jmd_n_len: int, &gt;0</span>
-<span class="sd">            Length of JMD-N.</span>
-<span class="sd">        jmd_c_len: int, &gt;0</span>
-<span class="sd">            Length of JMD-C.</span>
-<span class="sd">        ext_len:int, &gt;0</span>
-<span class="sd">            Length of TMD-extending part (starting from C and N terminal part of TMD).</span>
-<span class="sd">            Conditions: ext_len&lt;jmd_m_len and ext_len&lt;jmd_c_len</span>
-<span class="sd">        start: int, &gt;=0</span>
-<span class="sd">            Position label of first amino acid position (starting at N-terminus).</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        feat_names: list of strings</span>
-<span class="sd">            Names of features.</span>
-
-<span class="sd">        Notes</span>
-<span class="sd">        -----</span>
-<span class="sd">        Positions are given depending on the three split types:</span>
-<span class="sd">            - Segment: [first...last]</span>
-<span class="sd">            - Pattern: [all positions]</span>
-<span class="sd">            - PeriodicPattern: [first..step1/step2..last]</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="c1"># Check input (length checked in SequenceFeaturePositions)</span>
-        <span class="n">features</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_features</span><span class="p">(</span><span class="n">features</span><span class="o">=</span><span class="n">features</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_df_cat</span><span class="p">(</span><span class="n">df_cat</span><span class="o">=</span><span class="n">df_cat</span><span class="p">)</span>
-        <span class="k">if</span> <span class="n">df_cat</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">df_cat</span> <span class="o">=</span> <span class="n">aa</span><span class="o">.</span><span class="n">load_scales</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="n">ut</span><span class="o">.</span><span class="n">STR_SCALE_CAT</span><span class="p">)</span>
-        <span class="c1"># Get feature names</span>
-        <span class="n">sfp</span> <span class="o">=</span> <span class="n">SequenceFeaturePositions</span><span class="p">()</span>
-        <span class="n">dict_part_pos</span> <span class="o">=</span> <span class="n">sfp</span><span class="o">.</span><span class="n">get_dict_part_pos</span><span class="p">(</span><span class="n">tmd_len</span><span class="o">=</span><span class="n">tmd_len</span><span class="p">,</span> <span class="n">jmd_n_len</span><span class="o">=</span><span class="n">jmd_n_len</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="n">jmd_c_len</span><span class="p">,</span>
-                                              <span class="n">ext_len</span><span class="o">=</span><span class="n">ext_len</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="n">start</span><span class="p">)</span>
-        <span class="n">list_positions</span> <span class="o">=</span> <span class="n">sfp</span><span class="o">.</span><span class="n">get_positions</span><span class="p">(</span><span class="n">dict_part_pos</span><span class="o">=</span><span class="n">dict_part_pos</span><span class="p">,</span> <span class="n">features</span><span class="o">=</span><span class="n">features</span><span class="p">)</span>
-        <span class="n">dict_scales</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">df_cat</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SCALE_ID</span><span class="p">],</span> <span class="n">df_cat</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SCALE_NAME</span><span class="p">]))</span>
-        <span class="n">feat_names</span> <span class="o">=</span> <span class="p">[]</span>
-        <span class="k">for</span> <span class="n">feat_id</span><span class="p">,</span> <span class="n">pos</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">features</span><span class="p">,</span> <span class="n">list_positions</span><span class="p">):</span>
-            <span class="n">part</span><span class="p">,</span> <span class="n">split</span><span class="p">,</span> <span class="n">scale</span> <span class="o">=</span> <span class="n">feat_id</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;-&quot;</span><span class="p">)</span>
-            <span class="n">split_type</span> <span class="o">=</span> <span class="n">split</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;(&quot;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-            <span class="k">if</span> <span class="n">split_type</span> <span class="o">==</span> <span class="n">ut</span><span class="o">.</span><span class="n">STR_SEGMENT</span> <span class="ow">and</span> <span class="nb">len</span><span class="p">(</span><span class="n">pos</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;,&quot;</span><span class="p">))</span> <span class="o">&gt;</span> <span class="mi">2</span><span class="p">:</span>
-                <span class="n">pos</span> <span class="o">=</span> <span class="n">pos</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;,&quot;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="s2">&quot;...&quot;</span> <span class="o">+</span> <span class="n">pos</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;,&quot;</span><span class="p">)[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-            <span class="k">if</span> <span class="n">split_type</span> <span class="o">==</span> <span class="n">ut</span><span class="o">.</span><span class="n">STR_PERIODIC_PATTERN</span><span class="p">:</span>
-                <span class="n">step</span> <span class="o">=</span> <span class="n">split</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;+&quot;</span><span class="p">)[</span><span class="mi">1</span><span class="p">]</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;,&quot;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-                <span class="n">pos</span> <span class="o">=</span> <span class="n">pos</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;,&quot;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="s2">&quot;..&quot;</span> <span class="o">+</span> <span class="n">step</span> <span class="o">+</span> <span class="s2">&quot;..&quot;</span> <span class="o">+</span> <span class="n">pos</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;,&quot;</span><span class="p">)[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-            <span class="n">feat_names</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">dict_scales</span><span class="p">[</span><span class="n">scale</span><span class="p">]</span><span class="si">}</span><span class="s2"> [</span><span class="si">{</span><span class="n">pos</span><span class="si">}</span><span class="s2">]&quot;</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">feat_names</span></div>
-
-    <span class="c1"># Feature: Part + Split + Scale</span>
-    <span class="c1"># For what used? Not redudant with feature matrix?</span>
-    <span class="c1"># TODO Add functions (modify df_feat)</span>
-<div class="viewcode-block" id="SequenceFeature.add_feat_value"><a class="viewcode-back" href="../../../generated/aaanalysis.SequenceFeature.html#aaanalysis.SequenceFeature.add_feat_value">[docs]</a>    <span class="nd">@staticmethod</span>
-    <span class="k">def</span> <span class="nf">add_feat_value</span><span class="p">(</span><span class="n">df_parts</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">split</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">dict_scale</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">accept_gaps</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;Create feature values for all sequence parts by combining Part, Split, and Scale.</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        df_parts: :class:`pandas.DataFrame`</span>
-<span class="sd">            DataFrame with sequence parts.</span>
-<span class="sd">        split: str</span>
-<span class="sd">            Name of Split following given convention.</span>
-<span class="sd">        dict_scale: dict</span>
-<span class="sd">            Dictionary mapping a numerical value to each letter of given sequences</span>
-<span class="sd">        accept_gaps: bool, default = False</span>
-<span class="sd">            Whether to accept missing values by enabling omitting for computations (if True).</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        feature_value: array-like, shape (n_samples, n_parts)</span>
-<span class="sd">            Average scale values over sequence parts.</span>
-
-<span class="sd">        Notes</span>
-<span class="sd">        -----</span>
-<span class="sd">        A split name should has the form of PART-SPLIT-SCALE, where following structures</span>
-<span class="sd">        are given for the three split types:</span>
-
-<span class="sd">        - Segment(i-th,n_split)</span>
-<span class="sd">            with i-th&lt;=n_split and</span>
-<span class="sd">            where &#39;i-th&#39; and &#39;n_split&#39; indicate the i-th Segment resp. the number of Segments.</span>
-
-<span class="sd">        - Pattern(N/C,p1,p2,...,pn)</span>
-<span class="sd">            with p1&lt;p2&lt;...&lt;pn indicating amino acid positions and</span>
-<span class="sd">            &#39;N/C&#39; whether the splits starts from the N resp. C-terminal sequence end.</span>
-
-<span class="sd">        - PeriodicPattern(N/C,i+step1/step2,start)</span>
-<span class="sd">            where &#39;step1/step2&#39; indicates the step size of each odd resp. even step and</span>
-<span class="sd">            &#39;start&#39; gives the first position starting from the N- or C-terminal sequence end.</span>
-
-<span class="sd">        All numbers should be non-negative integers. Examples for each split type</span>
-<span class="sd">        are as follows: &#39;Segment(5,7)&#39;, &#39;Pattern(C,1,2)&#39;, &#39;PeriodicPattern(N,i+2/3,1)&#39;.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_df_parts</span><span class="p">(</span><span class="n">df_parts</span><span class="o">=</span><span class="n">df_parts</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_split</span><span class="p">(</span><span class="n">split</span><span class="o">=</span><span class="n">split</span><span class="p">)</span>
-        <span class="n">check_dict_scale</span><span class="p">(</span><span class="n">dict_scale</span><span class="o">=</span><span class="n">dict_scale</span><span class="p">,</span> <span class="n">df_parts</span><span class="o">=</span><span class="n">df_parts</span><span class="p">,</span> <span class="n">accept_gaps</span><span class="o">=</span><span class="n">accept_gaps</span><span class="p">)</span>
-        <span class="n">feature_value</span> <span class="o">=</span> <span class="n">_feature_value</span><span class="p">(</span><span class="n">df_parts</span><span class="o">=</span><span class="n">df_parts</span><span class="p">,</span>
-                                       <span class="n">split</span><span class="o">=</span><span class="n">split</span><span class="p">,</span>
-                                       <span class="n">dict_scale</span><span class="o">=</span><span class="n">dict_scale</span><span class="p">,</span>
-                                       <span class="n">accept_gaps</span><span class="o">=</span><span class="n">accept_gaps</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">feature_value</span></div>
-
-<div class="viewcode-block" id="SequenceFeature.add_dif"><a class="viewcode-back" href="../../../generated/aaanalysis.SequenceFeature.html#aaanalysis.SequenceFeature.add_dif">[docs]</a>    <span class="nd">@staticmethod</span>
-    <span class="k">def</span> <span class="nf">add_dif</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">df_seq</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">sample_name</span><span class="o">=</span><span class="nb">str</span><span class="p">,</span> <span class="n">ref_group</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                <span class="n">accept_gaps</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">jmd_n_len</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">df_parts</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">df_scales</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Add feature value difference between sample and reference group to DataFrame.</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        df_feat: :class:`pandas.DataFrame`</span>
-<span class="sd">            Feature DataFrame (CPP output) to add sample difference.</span>
-<span class="sd">        df_seq: :class:`pandas.DataFrame`</span>
-<span class="sd">            DataFrame with sequences and sample names, in which the given sample name is included.</span>
-<span class="sd">        labels: array-like, shape (n_samples)</span>
-<span class="sd">            Class labels for samples in sequence DataFrame.</span>
-<span class="sd">        sample_name: str</span>
-<span class="sd">            Name of sample for which the feature value difference to a given reference group should be computed.</span>
-<span class="sd">        ref_group: int, default = 0</span>
-<span class="sd">            Class label of reference group.</span>
-<span class="sd">        accept_gaps: bool, default = False</span>
-<span class="sd">            Whether to accept missing values by enabling omitting for computations (if True).</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        df_feat: :class:`pandas.DataFrame`</span>
-<span class="sd">            Feature DataFrame including feature value difference.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="c1"># Check input</span>
-        <span class="n">df_feat</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_df_feat</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="n">df_feat</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_df_seq</span><span class="p">(</span><span class="n">df_seq</span><span class="o">=</span><span class="n">df_seq</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="n">jmd_c_len</span><span class="p">,</span> <span class="n">jmd_n_len</span><span class="o">=</span><span class="n">jmd_n_len</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_labels</span><span class="p">(</span><span class="n">labels</span><span class="o">=</span><span class="n">labels</span><span class="p">,</span> <span class="n">df</span><span class="o">=</span><span class="n">df_seq</span><span class="p">,</span> <span class="n">name_df</span><span class="o">=</span><span class="s2">&quot;df_seq&quot;</span><span class="p">)</span>
-        <span class="n">check_ref_group</span><span class="p">(</span><span class="n">ref_group</span><span class="o">=</span><span class="n">ref_group</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="n">labels</span><span class="p">)</span>
-        <span class="n">check_sample_in_df_seq</span><span class="p">(</span><span class="n">sample_name</span><span class="o">=</span><span class="n">sample_name</span><span class="p">,</span> <span class="n">df_seq</span><span class="o">=</span><span class="n">df_seq</span><span class="p">)</span>
-        <span class="c1"># Add sample difference to reference group</span>
-        <span class="n">sf</span> <span class="o">=</span> <span class="n">SequenceFeature</span><span class="p">()</span>
-        <span class="n">X</span> <span class="o">=</span> <span class="n">sf</span><span class="o">.</span><span class="n">feat_matrix</span><span class="p">(</span><span class="n">features</span><span class="o">=</span><span class="nb">list</span><span class="p">(</span><span class="n">df_feat</span><span class="p">[</span><span class="s2">&quot;feature&quot;</span><span class="p">]),</span>
-                           <span class="n">df_parts</span><span class="o">=</span><span class="n">df_parts</span><span class="p">,</span>
-                           <span class="n">df_scales</span><span class="o">=</span><span class="n">df_scales</span><span class="p">,</span>
-                           <span class="n">accept_gaps</span><span class="o">=</span><span class="n">accept_gaps</span><span class="p">)</span>
-        <span class="n">mask</span> <span class="o">=</span> <span class="p">[</span><span class="kc">True</span> <span class="k">if</span> <span class="n">x</span> <span class="o">==</span> <span class="n">ref_group</span> <span class="k">else</span> <span class="kc">False</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">]</span>
-        <span class="n">i</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">df_seq</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_NAME</span><span class="p">])</span><span class="o">.</span><span class="n">index</span><span class="p">(</span><span class="n">sample_name</span><span class="p">)</span>
-        <span class="n">df_feat</span><span class="p">[</span><span class="sa">f</span><span class="s2">&quot;dif_</span><span class="si">{</span><span class="n">sample_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">X</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">-</span> <span class="n">X</span><span class="p">[</span><span class="n">mask</span><span class="p">]</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
-        <span class="k">return</span> <span class="n">df_feat</span></div>
-
-<div class="viewcode-block" id="SequenceFeature.add_position"><a class="viewcode-back" href="../../../generated/aaanalysis.SequenceFeature.html#aaanalysis.SequenceFeature.add_position">[docs]</a>    <span class="nd">@staticmethod</span>
-    <span class="k">def</span> <span class="nf">add_position</span><span class="p">(</span><span class="n">df_feat</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">features</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">tmd_len</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span> <span class="n">jmd_n_len</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">ext_len</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span>
-                     <span class="n">part_split</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;Create list with positions for given feature names</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        df_feat: :class:`pandas.DataFrame`</span>
-<span class="sd">            Feature DataFrame (CPP output) to add sample difference.</span>
-<span class="sd">        features: str, list of strings, pd.Series</span>
-<span class="sd">            Ids of features for which feature names should be created.</span>
-<span class="sd">        start: int, &gt;=0, default = 1</span>
-<span class="sd">            Position label of first amino acid position (starting at N-terminus).</span>
-<span class="sd">        tmd_len: int, &gt;0, default = 20</span>
-<span class="sd">            Length of TMD.</span>
-<span class="sd">        jmd_n_len : int, &gt;=0, default = 10</span>
-<span class="sd">            Length of JMD-N.</span>
-<span class="sd">        jmd_c_len : int, &gt;=0, default = 10</span>
-<span class="sd">            Length of JMD-C.</span>
-<span class="sd">        ext_len : int, &gt;=0, default = 4</span>
-<span class="sd">            Length of TMD-extending part (starting from C and N terminal part of TMD).</span>
-<span class="sd">            Conditions: ext_len &lt; jmd_m_len and ext_len &lt; jmd_c_len.</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        feat_positions: list</span>
-<span class="sd">            list with positions for each feature in feat_names</span>
-
-<span class="sd">        Notes</span>
-<span class="sd">        -----</span>
-<span class="sd">        The length parameters define the total number of positions (jmd_n_len + tmd_len + jmd_c_len).</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="c1"># TODO add sequence, generalize check functions for tmd_len ...</span>
-        <span class="n">features</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">check_features</span><span class="p">(</span><span class="n">features</span><span class="o">=</span><span class="n">features</span><span class="p">)</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;tmd_len&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">tmd_len</span><span class="p">,</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-        <span class="n">args</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">jmd_n_len</span><span class="o">=</span><span class="n">jmd_n_len</span><span class="p">,</span> <span class="n">jmd_c_len</span><span class="o">=</span><span class="n">jmd_c_len</span><span class="p">,</span> <span class="n">ext_len</span><span class="o">=</span><span class="n">ext_len</span><span class="p">,</span> <span class="n">start</span><span class="o">=</span><span class="n">start</span><span class="p">)</span>
-        <span class="k">for</span> <span class="n">name</span> <span class="ow">in</span> <span class="n">args</span><span class="p">:</span>
-            <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">args</span><span class="p">[</span><span class="n">name</span><span class="p">],</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-        <span class="n">sfp</span> <span class="o">=</span> <span class="n">SequenceFeaturePositions</span><span class="p">()</span>
-        <span class="n">dict_part_pos</span> <span class="o">=</span> <span class="n">sfp</span><span class="o">.</span><span class="n">get_dict_part_pos</span><span class="p">(</span><span class="n">tmd_len</span><span class="o">=</span><span class="n">tmd_len</span><span class="p">,</span> <span class="o">**</span><span class="n">args</span><span class="p">)</span>
-        <span class="n">feat_positions</span> <span class="o">=</span> <span class="n">sfp</span><span class="o">.</span><span class="n">get_positions</span><span class="p">(</span><span class="n">dict_part_pos</span><span class="o">=</span><span class="n">dict_part_pos</span><span class="p">,</span> <span class="n">features</span><span class="o">=</span><span class="n">features</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">feat_positions</span></div></div>
-
-</pre></div>
-
-           </div>
-          </div>
-          <footer>
-
-  <hr/>
-
-  <div role="contentinfo">
-    <p>&#169; Copyright 2023, Stephan Breimann.</p>
-  </div>
-
-   
-
-</footer>
-        </div>
-      </div>
-    </section>
-  </div>
-  <script>
-      jQuery(function () {
-          SphinxRtdTheme.Navigation.enable(true);
-      });
-  </script> 
-
-</body>
-</html>
\ No newline at end of file
diff --git a/docs/build/html/_modules/aaanalysis/data_loader/data_loader.html b/docs/build/html/_modules/aaanalysis/data_loader/data_loader.html
deleted file mode 100644
index ec73ec85..00000000
--- a/docs/build/html/_modules/aaanalysis/data_loader/data_loader.html
+++ /dev/null
@@ -1,294 +0,0 @@
-<!DOCTYPE html>
-<html class="writer-html5" lang="en" >
-<head>
-  <meta charset="utf-8" />
-  <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-  <title>aaanalysis.data_loader.data_loader &mdash; AAanalysis</title>
-      <link rel="stylesheet" href="../../../_static/pygments.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/css/theme.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/copybutton.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/plot_directive.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/css/style.css" type="text/css" />
-    <link rel="shortcut icon" href="../../../_static/logo_small.png"/>
-  <!--[if lt IE 9]>
-    <script src="../../../_static/js/html5shiv.min.js"></script>
-  <![endif]-->
-  
-        <script data-url_root="../../../" id="documentation_options" src="../../../_static/documentation_options.js"></script>
-        <script src="../../../_static/jquery.js"></script>
-        <script src="../../../_static/underscore.js"></script>
-        <script src="../../../_static/_sphinx_javascript_frameworks_compat.js"></script>
-        <script src="../../../_static/doctools.js"></script>
-        <script src="../../../_static/sphinx_highlight.js"></script>
-        <script src="../../../_static/clipboard.min.js"></script>
-        <script src="../../../_static/copybutton.js"></script>
-        <script src="../../../_static/design-tabs.js"></script>
-    <script src="../../../_static/js/theme.js"></script>
-    <link rel="index" title="Index" href="../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../search.html" /> 
-</head>
-
-<body class="wy-body-for-nav"> 
-  <div class="wy-grid-for-nav">
-    <nav data-toggle="wy-nav-shift" class="wy-nav-side">
-      <div class="wy-side-scroll">
-        <div class="wy-side-nav-search"  style="background: #343131" >
-            <a href="../../../index.html">
-            <img src="../../../_static/logo_big_trans.png" class="logo" alt="Logo"/>
-          </a>
-              <div class="version">
-                latest
-              </div>
-<div role="search">
-  <form id="rtd-search-form" class="wy-form" action="../../../search.html" method="get">
-    <input type="text" name="q" placeholder="Search docs" />
-    <input type="hidden" name="check_keywords" value="yes" />
-    <input type="hidden" name="area" value="default" />
-  </form>
-</div>
-        </div><div class="wy-menu wy-menu-vertical" data-spy="affix" role="navigation" aria-label="Navigation menu">
-              <p class="caption" role="heading"><span class="caption-text">OVERVIEW</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/introduction.html">Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/usage_principles.html">Usage Principles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/CONTRIBUTING_COPY.html">Contributing</a></li>
-</ul>
-<p class="caption" role="heading"><span class="caption-text">EXAMPLES</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../tutorials.html">Tutorials</a></li>
-</ul>
-<p class="caption" role="heading"><span class="caption-text">REFERENCES</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../api.html">API</a></li>
-</ul>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../_index/tables.html">Tables</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/references.html">References</a></li>
-</ul>
-
-        </div>
-      </div>
-    </nav>
-
-    <section data-toggle="wy-nav-shift" class="wy-nav-content-wrap"><nav class="wy-nav-top" aria-label="Mobile navigation menu"  style="background: #343131" >
-          <i data-toggle="wy-nav-top" class="fa fa-bars"></i>
-          <a href="../../../index.html">AAanalysis</a>
-      </nav>
-
-      <div class="wy-nav-content">
-        <div class="rst-content">
-          <div role="navigation" aria-label="Page navigation">
-  <ul class="wy-breadcrumbs">
-      <li><a href="../../../index.html" class="icon icon-home"></a></li>
-          <li class="breadcrumb-item"><a href="../../index.html">Module code</a></li>
-      <li class="breadcrumb-item active">aaanalysis.data_loader.data_loader</li>
-      <li class="wy-breadcrumbs-aside">
-      </li>
-  </ul>
-  <hr/>
-</div>
-          <div role="main" class="document" itemscope="itemscope" itemtype="http://schema.org/Article">
-           <div itemprop="articleBody">
-             
-  <h1>Source code for aaanalysis.data_loader.data_loader</h1><div class="highlight"><pre>
-<span></span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">This is a script for loading protein sequence benchmarking datasets and amino acid scales and</span>
-<span class="sd">their two-level classification (AAontology).</span>
-<span class="sd">&quot;&quot;&quot;</span>
-<span class="kn">import</span> <span class="nn">os</span>
-<span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
-<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-<span class="kn">import</span> <span class="nn">re</span>
-<span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Optional</span><span class="p">,</span> <span class="n">Literal</span>
-<span class="kn">import</span> <span class="nn">aaanalysis.utils</span> <span class="k">as</span> <span class="nn">ut</span>
-
-<span class="c1"># Constants</span>
-<span class="n">STR_AA_GAP</span> <span class="o">=</span> <span class="s2">&quot;-&quot;</span>
-<span class="n">LIST_CANONICAL_AA</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;N&#39;</span><span class="p">,</span> <span class="s1">&#39;A&#39;</span><span class="p">,</span> <span class="s1">&#39;I&#39;</span><span class="p">,</span> <span class="s1">&#39;V&#39;</span><span class="p">,</span> <span class="s1">&#39;K&#39;</span><span class="p">,</span> <span class="s1">&#39;Q&#39;</span><span class="p">,</span> <span class="s1">&#39;R&#39;</span><span class="p">,</span> <span class="s1">&#39;M&#39;</span><span class="p">,</span> <span class="s1">&#39;H&#39;</span><span class="p">,</span> <span class="s1">&#39;F&#39;</span><span class="p">,</span> <span class="s1">&#39;E&#39;</span><span class="p">,</span> <span class="s1">&#39;D&#39;</span><span class="p">,</span> <span class="s1">&#39;C&#39;</span><span class="p">,</span> <span class="s1">&#39;G&#39;</span><span class="p">,</span> <span class="s1">&#39;L&#39;</span><span class="p">,</span> <span class="s1">&#39;T&#39;</span><span class="p">,</span> <span class="s1">&#39;S&#39;</span><span class="p">,</span> <span class="s1">&#39;Y&#39;</span><span class="p">,</span> <span class="s1">&#39;W&#39;</span><span class="p">,</span> <span class="s1">&#39;P&#39;</span><span class="p">]</span>
-<span class="n">NAME_SCALE_SETS_BASE</span> <span class="o">=</span> <span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">STR_SCALES</span><span class="p">,</span> <span class="n">ut</span><span class="o">.</span><span class="n">STR_SCALES_RAW</span><span class="p">]</span>
-<span class="n">NAMES_SCALE_SETS</span> <span class="o">=</span> <span class="n">NAME_SCALE_SETS_BASE</span> <span class="o">+</span> <span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">STR_SCALE_CAT</span><span class="p">,</span> <span class="n">ut</span><span class="o">.</span><span class="n">STR_SCALES_PC</span><span class="p">,</span> <span class="n">ut</span><span class="o">.</span><span class="n">STR_TOP60</span><span class="p">,</span> <span class="n">ut</span><span class="o">.</span><span class="n">STR_TOP60_EVAL</span><span class="p">]</span>
-<span class="n">FOLDER_BENCHMARKS</span> <span class="o">=</span> <span class="n">folder_in</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">FOLDER_DATA</span> <span class="o">+</span> <span class="s2">&quot;benchmarks&quot;</span> <span class="o">+</span> <span class="n">ut</span><span class="o">.</span><span class="n">SEP</span>
-
-<span class="c1"># I Helper Functions</span>
-
-
-<span class="c1"># II Main Functions</span>
-<span class="k">def</span> <span class="nf">_adjust_non_canonical_aa</span><span class="p">(</span><span class="n">df</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">non_canonical_aa</span><span class="o">=</span><span class="s2">&quot;remove&quot;</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span>
-    <span class="n">list_options</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;remove&quot;</span><span class="p">,</span> <span class="s2">&quot;keep&quot;</span><span class="p">,</span> <span class="s2">&quot;gap&quot;</span><span class="p">]</span>
-    <span class="k">if</span> <span class="n">non_canonical_aa</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">list_options</span><span class="p">:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;&#39;non_canonical_aa&#39; (</span><span class="si">{</span><span class="n">non_canonical_aa</span><span class="si">}</span><span class="s2">) should be on of following: </span><span class="si">{</span><span class="n">list_options</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">non_canonical_aa</span> <span class="o">==</span> <span class="s2">&quot;keep&quot;</span><span class="p">:</span>
-        <span class="k">return</span> <span class="n">df</span>
-    <span class="c1"># Get all non-canonical amino acids</span>
-    <span class="n">f</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="nb">set</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">x</span><span class="p">))</span>
-    <span class="n">vf</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">vectorize</span><span class="p">(</span><span class="n">f</span><span class="p">)</span>
-    <span class="n">char_seq</span> <span class="o">=</span> <span class="nb">set</span><span class="p">()</span><span class="o">.</span><span class="n">union</span><span class="p">(</span><span class="o">*</span><span class="n">vf</span><span class="p">(</span><span class="n">df</span><span class="o">.</span><span class="n">values</span><span class="p">)</span><span class="o">.</span><span class="n">flatten</span><span class="p">())</span>
-    <span class="n">list_non_canonical_aa</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">char_seq</span> <span class="k">if</span> <span class="n">x</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">LIST_CANONICAL_AA</span><span class="p">]</span>
-    <span class="k">if</span> <span class="n">non_canonical_aa</span> <span class="o">==</span> <span class="s2">&quot;remove&quot;</span><span class="p">:</span>
-        <span class="n">pattern</span> <span class="o">=</span> <span class="s1">&#39;|&#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">list_non_canonical_aa</span><span class="p">)</span>  <span class="c1"># Joining list into a single regex pattern</span>
-        <span class="n">df</span> <span class="o">=</span> <span class="n">df</span><span class="p">[</span><span class="o">~</span><span class="n">df</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SEQ</span><span class="p">]</span><span class="o">.</span><span class="n">str</span><span class="o">.</span><span class="n">contains</span><span class="p">(</span><span class="n">pattern</span><span class="p">,</span> <span class="n">regex</span><span class="o">=</span><span class="kc">True</span><span class="p">)]</span>
-    <span class="k">else</span><span class="p">:</span>
-        <span class="n">df</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SEQ</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="n">re</span><span class="o">.</span><span class="n">sub</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;[</span><span class="si">{</span><span class="s2">&quot;&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">list_non_canonical_aa</span><span class="p">)</span><span class="si">}</span><span class="s1">]&#39;</span><span class="p">,</span> <span class="n">STR_AA_GAP</span><span class="p">,</span> <span class="n">x</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SEQ</span><span class="p">]]</span>
-    <span class="k">return</span> <span class="n">df</span>
-
-
-<span class="k">def</span> <span class="nf">check_name_of_dataset</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;INFO&quot;</span><span class="p">,</span> <span class="n">folder_in</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="n">name</span> <span class="o">==</span> <span class="s2">&quot;INFO&quot;</span><span class="p">:</span>
-        <span class="k">return</span>
-    <span class="n">list_datasets</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;.&quot;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">os</span><span class="o">.</span><span class="n">listdir</span><span class="p">(</span><span class="n">folder_in</span><span class="p">)</span> <span class="k">if</span> <span class="s2">&quot;.&quot;</span> <span class="ow">in</span> <span class="n">x</span><span class="p">]</span>
-    <span class="k">if</span> <span class="n">name</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">list_datasets</span><span class="p">:</span>
-        <span class="n">list_aa</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">list_datasets</span> <span class="k">if</span> <span class="s1">&#39;AA&#39;</span> <span class="ow">in</span> <span class="n">x</span><span class="p">]</span>
-        <span class="n">list_seq</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">list_datasets</span> <span class="k">if</span> <span class="s1">&#39;SEQ&#39;</span> <span class="ow">in</span> <span class="n">x</span><span class="p">]</span>
-        <span class="n">list_dom</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">list_datasets</span> <span class="k">if</span> <span class="s1">&#39;DOM&#39;</span> <span class="ow">in</span> <span class="n">x</span><span class="p">]</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;&#39;name&#39; (</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">) is not valid.&quot;</span>
-                         <span class="sa">f</span><span class="s2">&quot;</span><span class="se">\n</span><span class="s2"> Amino acid datasets: </span><span class="si">{</span><span class="n">list_aa</span><span class="si">}</span><span class="s2">&quot;</span>
-                         <span class="sa">f</span><span class="s2">&quot;</span><span class="se">\n</span><span class="s2"> Sequence datasets: </span><span class="si">{</span><span class="n">list_seq</span><span class="si">}</span><span class="s2">&quot;</span>
-                         <span class="sa">f</span><span class="s2">&quot;</span><span class="se">\n</span><span class="s2"> Domain datasets: </span><span class="si">{</span><span class="n">list_dom</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-
-
-<div class="viewcode-block" id="load_dataset"><a class="viewcode-back" href="../../../generated/aaanalysis.load_dataset.html#aaanalysis.load_dataset">[docs]</a><span class="k">def</span> <span class="nf">load_dataset</span><span class="p">(</span><span class="n">name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;INFO&quot;</span><span class="p">,</span>
-                 <span class="n">n</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-                 <span class="n">non_canonical_aa</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s2">&quot;remove&quot;</span><span class="p">,</span> <span class="s2">&quot;keep&quot;</span><span class="p">,</span> <span class="s2">&quot;gap&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;remove&quot;</span><span class="p">,</span>
-                 <span class="n">min_len</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-                 <span class="n">max_len</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">:</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Load protein benchmarking datasets.</span>
-
-<span class="sd">    The benchmarks are  distinguished into amino acid (&#39;AA&#39;), domain (&#39;DOM&#39;), and sequence (&#39;SEQ&#39;) level</span>
-<span class="sd">    datasets. Use default settings (name=&#39;INFO&#39;) of an overview table. Detailed analysis is in :cite:`Breimann23a`.</span>
-
-<span class="sd">    Parameters</span>
-<span class="sd">    ----------</span>
-<span class="sd">    name</span>
-<span class="sd">        Name of the dataset. See &#39;Dataset&#39; column in overview table.</span>
-<span class="sd">    n</span>
-<span class="sd">        Number of proteins per class. If None, the whole dataset will be returned.</span>
-<span class="sd">    non_canonical_aa</span>
-<span class="sd">        Options for modifying non-canonical amino acids:</span>
-
-<span class="sd">        - &#39;remove&#39;: Remove sequences containing non-canonical amino acids.</span>
-
-<span class="sd">        - &#39;keep&#39;: Do not remove sequences containing non-canonical amino acids.</span>
-
-<span class="sd">        - &#39;gap&#39;: Non-canonical amino acids are replaced by gap symbol (&#39;X&#39;).</span>
-
-<span class="sd">    min_len</span>
-<span class="sd">        Minimum length of sequences for filtering (disabled by default).</span>
-<span class="sd">    max_len</span>
-<span class="sd">        Maximum length of sequences for filtering (disabled by default).</span>
-
-<span class="sd">    Returns</span>
-<span class="sd">    -------</span>
-<span class="sd">    df_seq</span>
-<span class="sd">        Dataframe with the selected sequence dataset.</span>
-
-<span class="sd">    Notes</span>
-<span class="sd">    -----</span>
-<span class="sd">    See further information on the benchmark datasets in ref table.</span>
-
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;n&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">n</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;min_len&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">min_len</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-    <span class="n">check_name_of_dataset</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">,</span> <span class="n">folder_in</span><span class="o">=</span><span class="n">FOLDER_BENCHMARKS</span><span class="p">)</span>
-    <span class="c1"># Load overview table</span>
-    <span class="k">if</span> <span class="n">name</span> <span class="o">==</span> <span class="s2">&quot;INFO&quot;</span><span class="p">:</span>
-        <span class="k">return</span> <span class="n">pd</span><span class="o">.</span><span class="n">read_excel</span><span class="p">(</span><span class="n">FOLDER_BENCHMARKS</span> <span class="o">+</span> <span class="s2">&quot;INFO_benchmarks.xlsx&quot;</span><span class="p">)</span>
-    <span class="n">df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">read_csv</span><span class="p">(</span><span class="n">FOLDER_BENCHMARKS</span> <span class="o">+</span> <span class="n">name</span> <span class="o">+</span> <span class="s2">&quot;.tsv&quot;</span><span class="p">,</span> <span class="n">sep</span><span class="o">=</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">&quot;</span><span class="p">)</span>
-    <span class="c1"># Filter Rdata</span>
-    <span class="k">if</span> <span class="n">min_len</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">mask</span> <span class="o">=</span> <span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="o">&gt;=</span> <span class="n">min_len</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SEQ</span><span class="p">]]</span>
-        <span class="n">df</span> <span class="o">=</span> <span class="n">df</span><span class="p">[</span><span class="n">mask</span><span class="p">]</span>
-    <span class="k">if</span> <span class="n">max_len</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">mask</span> <span class="o">=</span> <span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="o">&lt;=</span> <span class="n">max_len</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">df</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SEQ</span><span class="p">]]</span>
-        <span class="n">df</span> <span class="o">=</span> <span class="n">df</span><span class="p">[</span><span class="n">mask</span><span class="p">]</span>
-    <span class="c1"># Adjust non-canonical amino acid (keep, remove, or replace by gap)</span>
-    <span class="n">df_seq</span> <span class="o">=</span> <span class="n">_adjust_non_canonical_aa</span><span class="p">(</span><span class="n">df</span><span class="o">=</span><span class="n">df</span><span class="p">,</span> <span class="n">non_canonical_aa</span><span class="o">=</span><span class="n">non_canonical_aa</span><span class="p">)</span>
-    <span class="c1"># Select balanced groups</span>
-    <span class="k">if</span> <span class="n">n</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">labels</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">df_seq</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_LABEL</span><span class="p">])</span>
-        <span class="n">df_seq</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">concat</span><span class="p">([</span><span class="n">df_seq</span><span class="p">[</span><span class="n">df_seq</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_LABEL</span><span class="p">]</span> <span class="o">==</span> <span class="n">l</span><span class="p">]</span><span class="o">.</span><span class="n">head</span><span class="p">(</span><span class="n">n</span><span class="p">)</span> <span class="k">for</span> <span class="n">l</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">])</span>
-    <span class="k">return</span> <span class="n">df_seq</span></div>
-
-
-<span class="c1"># Load scales</span>
-<span class="k">def</span> <span class="nf">_filter_scales</span><span class="p">(</span><span class="n">df_cat</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">unclassified_in</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">just_aaindex</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Filter scales for unclassified and aaindex scales&quot;&quot;&quot;</span>
-    <span class="n">list_ids_not_in_aaindex</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">df_cat</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SCALE_ID</span><span class="p">]</span> <span class="k">if</span> <span class="s2">&quot;LINS&quot;</span> <span class="ow">in</span> <span class="n">x</span> <span class="ow">or</span> <span class="s2">&quot;KOEH&quot;</span> <span class="ow">in</span> <span class="n">x</span><span class="p">]</span>
-    <span class="n">list_ids_unclassified</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span><span class="p">,</span> <span class="n">cat</span><span class="p">,</span> <span class="n">sub_cat</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">df_cat</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SCALE_ID</span><span class="p">],</span> <span class="n">df_cat</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_CAT</span><span class="p">],</span> <span class="n">df_cat</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SUBCAT</span><span class="p">])</span>
-                             <span class="k">if</span> <span class="s2">&quot;Unclassified&quot;</span> <span class="ow">in</span> <span class="n">sub_cat</span> <span class="ow">or</span> <span class="n">cat</span> <span class="o">==</span> <span class="s2">&quot;Others&quot;</span><span class="p">]</span>
-    <span class="n">list_ids_to_exclude</span> <span class="o">=</span> <span class="p">[]</span>
-    <span class="k">if</span> <span class="ow">not</span> <span class="n">unclassified_in</span><span class="p">:</span>
-        <span class="n">list_ids_to_exclude</span><span class="o">.</span><span class="n">extend</span><span class="p">(</span><span class="n">list_ids_unclassified</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">just_aaindex</span><span class="p">:</span>
-        <span class="n">list_ids_to_exclude</span><span class="o">.</span><span class="n">extend</span><span class="p">(</span><span class="n">list_ids_not_in_aaindex</span><span class="p">)</span>
-    <span class="n">df_cat</span> <span class="o">=</span> <span class="n">df_cat</span><span class="p">[</span><span class="o">~</span><span class="n">df_cat</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SCALE_ID</span><span class="p">]</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">list_ids_to_exclude</span><span class="p">)]</span>
-    <span class="k">return</span> <span class="n">df_cat</span>
-
-
-<span class="c1"># Extend for AAclustTop60</span>
-<div class="viewcode-block" id="load_scales"><a class="viewcode-back" href="../../../generated/aaanalysis.load_scales.html#aaanalysis.load_scales">[docs]</a><span class="k">def</span> <span class="nf">load_scales</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;scales&quot;</span><span class="p">,</span> <span class="n">just_aaindex</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">unclassified_in</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Load amino acid scales, scale classification (AAontology), or scale evaluation.</span>
-
-<span class="sd">    A through analysis of the residue and sequence datasets can be found in TODO[Breimann23a].</span>
-
-<span class="sd">    Parameters</span>
-<span class="sd">    ----------</span>
-<span class="sd">    name : str, default = &#39;scales&#39;</span>
-<span class="sd">        Name of the dataset to load. Options are &#39;scales&#39;, &#39;scales_raw&#39;, &#39;scale_cat&#39;,</span>
-<span class="sd">        &#39;scales_pc&#39;, &#39;top60&#39;, and &#39;top60_eval&#39;.</span>
-<span class="sd">    unclassified_in : bool, optional</span>
-<span class="sd">        Whether unclassified scales should be included. The &#39;Others&#39; category counts as unclassified.</span>
-<span class="sd">        Only relevant if `name` is &#39;scales&#39;, &#39;scales_raw&#39;, or &#39;scale_classification&#39;.</span>
-<span class="sd">    just_aaindex : bool, optional</span>
-<span class="sd">        Whether only scales provided from AAindex should be given.</span>
-<span class="sd">        Only relevant if `name` is &#39;scales&#39;, &#39;scales_raw&#39;, or &#39;scale_classification&#39;.</span>
-
-<span class="sd">    Returns</span>
-<span class="sd">    -------</span>
-<span class="sd">    df : :class:`pandas.DataFrame`</span>
-<span class="sd">        Dataframe for the selected scale dataset.</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="n">name</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">NAMES_SCALE_SETS</span><span class="p">:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;&#39;name&#39; (</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">) is not valid. Choose one of following: </span><span class="si">{</span><span class="n">NAMES_SCALE_SETS</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-    <span class="c1"># Load _data</span>
-    <span class="n">df_cat</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">read_excel</span><span class="p">(</span><span class="n">ut</span><span class="o">.</span><span class="n">FOLDER_DATA</span> <span class="o">+</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">ut</span><span class="o">.</span><span class="n">STR_SCALE_CAT</span><span class="si">}</span><span class="s2">.xlsx&quot;</span><span class="p">)</span>
-    <span class="n">df_cat</span> <span class="o">=</span> <span class="n">_filter_scales</span><span class="p">(</span><span class="n">df_cat</span><span class="o">=</span><span class="n">df_cat</span><span class="p">,</span> <span class="n">unclassified_in</span><span class="o">=</span><span class="n">unclassified_in</span><span class="p">,</span> <span class="n">just_aaindex</span><span class="o">=</span><span class="n">just_aaindex</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">name</span> <span class="o">==</span> <span class="n">ut</span><span class="o">.</span><span class="n">STR_SCALE_CAT</span><span class="p">:</span>
-        <span class="k">return</span> <span class="n">df_cat</span>
-    <span class="n">df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">read_excel</span><span class="p">(</span><span class="n">ut</span><span class="o">.</span><span class="n">FOLDER_DATA</span> <span class="o">+</span> <span class="n">name</span> <span class="o">+</span> <span class="s2">&quot;.xlsx&quot;</span><span class="p">,</span> <span class="n">index_col</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-    <span class="c1"># Filter scales</span>
-    <span class="k">if</span> <span class="n">name</span> <span class="ow">in</span> <span class="n">NAME_SCALE_SETS_BASE</span><span class="p">:</span>
-        <span class="n">df</span> <span class="o">=</span> <span class="n">df</span><span class="p">[[</span><span class="n">x</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">list</span><span class="p">(</span><span class="n">df</span><span class="p">)</span> <span class="k">if</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">list</span><span class="p">(</span><span class="n">df_cat</span><span class="p">[</span><span class="n">ut</span><span class="o">.</span><span class="n">COL_SCALE_ID</span><span class="p">])]]</span>
-    <span class="k">return</span> <span class="n">df</span></div>
-</pre></div>
-
-           </div>
-          </div>
-          <footer>
-
-  <hr/>
-
-  <div role="contentinfo">
-    <p>&#169; Copyright 2023, Stephan Breimann.</p>
-  </div>
-
-   
-
-</footer>
-        </div>
-      </div>
-    </section>
-  </div>
-  <script>
-      jQuery(function () {
-          SphinxRtdTheme.Navigation.enable(true);
-      });
-  </script> 
-
-</body>
-</html>
\ No newline at end of file
diff --git a/docs/build/html/_modules/aaanalysis/dpulearn/dpulearn.html b/docs/build/html/_modules/aaanalysis/dpulearn/dpulearn.html
deleted file mode 100644
index 8b39e1bb..00000000
--- a/docs/build/html/_modules/aaanalysis/dpulearn/dpulearn.html
+++ /dev/null
@@ -1,429 +0,0 @@
-<!DOCTYPE html>
-<html class="writer-html5" lang="en" >
-<head>
-  <meta charset="utf-8" />
-  <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-  <title>aaanalysis.dpulearn.dpulearn &mdash; AAanalysis</title>
-      <link rel="stylesheet" href="../../../_static/pygments.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/css/theme.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/copybutton.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/plot_directive.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/css/style.css" type="text/css" />
-    <link rel="shortcut icon" href="../../../_static/logo_small.png"/>
-  <!--[if lt IE 9]>
-    <script src="../../../_static/js/html5shiv.min.js"></script>
-  <![endif]-->
-  
-        <script data-url_root="../../../" id="documentation_options" src="../../../_static/documentation_options.js"></script>
-        <script src="../../../_static/jquery.js"></script>
-        <script src="../../../_static/underscore.js"></script>
-        <script src="../../../_static/_sphinx_javascript_frameworks_compat.js"></script>
-        <script src="../../../_static/doctools.js"></script>
-        <script src="../../../_static/sphinx_highlight.js"></script>
-        <script src="../../../_static/clipboard.min.js"></script>
-        <script src="../../../_static/copybutton.js"></script>
-        <script src="../../../_static/design-tabs.js"></script>
-    <script src="../../../_static/js/theme.js"></script>
-    <link rel="index" title="Index" href="../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../search.html" /> 
-</head>
-
-<body class="wy-body-for-nav"> 
-  <div class="wy-grid-for-nav">
-    <nav data-toggle="wy-nav-shift" class="wy-nav-side">
-      <div class="wy-side-scroll">
-        <div class="wy-side-nav-search"  style="background: #343131" >
-            <a href="../../../index.html">
-            <img src="../../../_static/logo_big_trans.png" class="logo" alt="Logo"/>
-          </a>
-              <div class="version">
-                latest
-              </div>
-<div role="search">
-  <form id="rtd-search-form" class="wy-form" action="../../../search.html" method="get">
-    <input type="text" name="q" placeholder="Search docs" />
-    <input type="hidden" name="check_keywords" value="yes" />
-    <input type="hidden" name="area" value="default" />
-  </form>
-</div>
-        </div><div class="wy-menu wy-menu-vertical" data-spy="affix" role="navigation" aria-label="Navigation menu">
-              <p class="caption" role="heading"><span class="caption-text">OVERVIEW</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/introduction.html">Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/usage_principles.html">Usage Principles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/CONTRIBUTING_COPY.html">Contributing</a></li>
-</ul>
-<p class="caption" role="heading"><span class="caption-text">EXAMPLES</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../tutorials.html">Tutorials</a></li>
-</ul>
-<p class="caption" role="heading"><span class="caption-text">REFERENCES</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../api.html">API</a></li>
-</ul>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../_index/tables.html">Tables</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/references.html">References</a></li>
-</ul>
-
-        </div>
-      </div>
-    </nav>
-
-    <section data-toggle="wy-nav-shift" class="wy-nav-content-wrap"><nav class="wy-nav-top" aria-label="Mobile navigation menu"  style="background: #343131" >
-          <i data-toggle="wy-nav-top" class="fa fa-bars"></i>
-          <a href="../../../index.html">AAanalysis</a>
-      </nav>
-
-      <div class="wy-nav-content">
-        <div class="rst-content">
-          <div role="navigation" aria-label="Page navigation">
-  <ul class="wy-breadcrumbs">
-      <li><a href="../../../index.html" class="icon icon-home"></a></li>
-          <li class="breadcrumb-item"><a href="../../index.html">Module code</a></li>
-      <li class="breadcrumb-item active">aaanalysis.dpulearn.dpulearn</li>
-      <li class="wy-breadcrumbs-aside">
-      </li>
-  </ul>
-  <hr/>
-</div>
-          <div role="main" class="document" itemscope="itemscope" itemtype="http://schema.org/Article">
-           <div itemprop="articleBody">
-             
-  <h1>Source code for aaanalysis.dpulearn.dpulearn</h1><div class="highlight"><pre>
-<span></span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">This is a script for deterministic Positive-Unlabeled (PU) Learning (dPULearn) class</span>
-<span class="sd">&quot;&quot;&quot;</span>
-<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-<span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
-<span class="kn">from</span> <span class="nn">sklearn.metrics</span> <span class="kn">import</span> <span class="n">pairwise_distances</span>
-<span class="kn">from</span> <span class="nn">sklearn.decomposition</span> <span class="kn">import</span> <span class="n">PCA</span>
-<span class="kn">import</span> <span class="nn">math</span>
-<span class="kn">import</span> <span class="nn">warnings</span>
-<span class="kn">import</span> <span class="nn">aaanalysis.utils</span> <span class="k">as</span> <span class="nn">ut</span>
-
-<span class="c1"># Settings</span>
-<span class="n">pd</span><span class="o">.</span><span class="n">set_option</span><span class="p">(</span><span class="s1">&#39;expand_frame_repr&#39;</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>  <span class="c1"># Single line print for pd.Dataframe</span>
-
-<span class="n">LIST_METRICS</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;euclidean&#39;</span><span class="p">,</span> <span class="s1">&#39;manhattan&#39;</span><span class="p">,</span> <span class="s1">&#39;cosine&#39;</span><span class="p">]</span>
-
-<span class="c1"># TODO better example in fit</span>
-<span class="c1"># TODO more check functions, improve with testing</span>
-
-<span class="c1"># I Helper Functions</span>
-<span class="c1"># Check functions</span>
-<span class="k">def</span> <span class="nf">_check_metric</span><span class="p">(</span><span class="n">metric</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="n">metric</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">metric</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">LIST_METRICS</span><span class="p">:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;&#39;metric&#39; (</span><span class="si">{</span><span class="n">metric</span><span class="si">}</span><span class="s2">) should be None or one of following: </span><span class="si">{</span><span class="n">LIST_METRICS</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-
-
-<span class="k">def</span> <span class="nf">_check_df_seq</span><span class="p">(</span><span class="n">df_seq</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">col_class</span><span class="o">=</span><span class="s2">&quot;class&quot;</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="n">df_seq</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="k">if</span> <span class="n">col_class</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">df_seq</span><span class="p">:</span>
-            <span class="n">columns</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">df_seq</span><span class="p">)</span>
-            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;&#39;col_class&#39; (</span><span class="si">{</span><span class="n">col_class</span><span class="si">}</span><span class="s2">) must be a column in &#39;df_seq&#39;: </span><span class="si">{</span><span class="n">columns</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-        <span class="k">if</span> <span class="ow">not</span> <span class="n">df_seq</span><span class="o">.</span><span class="n">index</span><span class="o">.</span><span class="n">is_unique</span><span class="p">:</span>
-            <span class="n">df_seq</span> <span class="o">=</span> <span class="n">df_seq</span><span class="o">.</span><span class="n">reset_index</span><span class="p">(</span><span class="n">drop</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-            <span class="n">warnings</span><span class="o">.</span><span class="n">warn</span><span class="p">(</span><span class="s2">&quot;&#39;df_seq&#39; index was not unique. The index has been reset.&quot;</span><span class="p">,</span> <span class="ne">UserWarning</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">df_seq</span>
-
-
-<span class="k">def</span> <span class="nf">_check_labels</span><span class="p">(</span><span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">label_pos</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-    <span class="c1"># Check if labels is an array or list</span>
-    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">labels</span><span class="p">,</span> <span class="p">(</span><span class="nb">list</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">)):</span>
-        <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;&#39;labels&#39; should be a list or a NumPy array, not </span><span class="si">{</span><span class="nb">type</span><span class="p">(</span><span class="n">labels</span><span class="p">)</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-
-    <span class="c1"># Check if labels contain integers</span>
-    <span class="k">if</span> <span class="ow">not</span> <span class="nb">all</span><span class="p">(</span><span class="nb">isinstance</span><span class="p">(</span><span class="n">label</span><span class="p">,</span> <span class="nb">int</span><span class="p">)</span> <span class="k">for</span> <span class="n">label</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">):</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All elements in &#39;labels&#39; should be integers&quot;</span><span class="p">)</span>
-    <span class="c1"># Check if label_pos in labels</span>
-    <span class="k">if</span> <span class="n">label_pos</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">:</span>
-        <span class="n">str_error</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;&#39;label_pos&#39; (&#39;</span><span class="si">{</span><span class="n">label_pos</span><span class="si">}</span><span class="s2">&#39;, default=1) should be in &#39;labels&#39; with (</span><span class="si">{</span><span class="nb">list</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">labels</span><span class="p">))</span><span class="si">}</span><span class="s2">)&quot;</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">str_error</span><span class="p">)</span>
-    <span class="c1"># Check if integers start with 0</span>
-    <span class="n">min_label</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">labels</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">min_label</span> <span class="o">!=</span> <span class="mi">0</span> <span class="ow">and</span> <span class="n">verbose</span><span class="p">:</span>
-        <span class="n">warnings</span><span class="o">.</span><span class="n">warn</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;The smallest label is </span><span class="si">{</span><span class="n">min_label</span><span class="si">}</span><span class="s2">, typically should start with 0&quot;</span><span class="p">)</span>
-
-    <span class="c1"># Check if integers are consecutive</span>
-    <span class="n">unique_labels</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span><span class="nb">set</span><span class="p">(</span><span class="n">labels</span><span class="p">))</span>
-    <span class="k">if</span> <span class="nb">any</span><span class="p">(</span><span class="n">unique_labels</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">-</span> <span class="n">unique_labels</span><span class="p">[</span><span class="n">i</span> <span class="o">-</span> <span class="mi">1</span><span class="p">]</span> <span class="o">!=</span> <span class="mi">1</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">unique_labels</span><span class="p">))):</span>
-        <span class="k">if</span> <span class="n">verbose</span><span class="p">:</span>
-            <span class="n">warnings</span><span class="o">.</span><span class="n">warn</span><span class="p">(</span><span class="s2">&quot;Labels are not consecutive integers&quot;</span><span class="p">)</span>
-    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">labels</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
-        <span class="n">labels</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">labels</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">labels</span>
-
-
-<span class="k">def</span> <span class="nf">_check_n_neg</span><span class="p">(</span><span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">n_neg</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">label_pos</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">label_neg</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s1">&#39;n_neg&#39;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">n_neg</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-    <span class="k">if</span> <span class="nb">sum</span><span class="p">([</span><span class="n">x</span> <span class="o">==</span> <span class="n">label_neg</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;&#39;labels&#39; should not contain labels for negatives (</span><span class="si">{</span><span class="n">label_neg</span><span class="si">}</span><span class="s2">)&quot;</span><span class="p">)</span>
-    <span class="n">n_pos</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">([</span><span class="n">x</span> <span class="o">==</span> <span class="n">label_pos</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">])</span>
-    <span class="n">n_unl</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">([</span><span class="n">x</span> <span class="o">!=</span> <span class="n">label_pos</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">labels</span><span class="p">])</span>
-    <span class="k">if</span> <span class="n">n_pos</span> <span class="o">&lt;</span> <span class="n">n_neg</span><span class="p">:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of positive labels (</span><span class="si">{</span><span class="n">n_pos</span><span class="si">}</span><span class="s2">) should higher than &#39;n_neg&#39; (</span><span class="si">{</span><span class="n">n_neg</span><span class="si">}</span><span class="s2">)&quot;</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">n_unl</span> <span class="o">&lt;</span> <span class="n">n_neg</span><span class="p">:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Number of unlabeled labels (</span><span class="si">{</span><span class="n">n_unl</span><span class="si">}</span><span class="s2">) should higher than &#39;n_neg&#39; (</span><span class="si">{</span><span class="n">n_neg</span><span class="si">}</span><span class="s2">)&quot;</span><span class="p">)</span>
-
-
-<span class="c1"># Pre-processing helper functions</span>
-<span class="k">def</span> <span class="nf">_get_label_neg</span><span class="p">(</span><span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span>
-    <span class="n">label_neg</span> <span class="o">=</span> <span class="mi">0</span> <span class="k">if</span> <span class="mi">0</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">labels</span> <span class="k">else</span> <span class="nb">max</span><span class="p">(</span><span class="n">labels</span><span class="p">)</span> <span class="o">+</span> <span class="mi">1</span>
-    <span class="k">return</span> <span class="n">label_neg</span>
-
-
-<span class="c1"># II Main Functions</span>
-<span class="k">def</span> <span class="nf">_get_neg_via_distance</span><span class="p">(</span><span class="n">X</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">metric</span><span class="o">=</span><span class="s2">&quot;euclidean&quot;</span><span class="p">,</span> <span class="n">n_neg</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                          <span class="n">df_seq</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">col_class</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                          <span class="n">label_neg</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">label_pos</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">name_neg</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Identify distant samples from positive mean as reliable negatives based on a specified distance metric.</span>
-
-<span class="sd">    Parameters:</span>
-<span class="sd">    - X: np.ndarray, The input feature matrix of shape (n_samples, n_features).</span>
-<span class="sd">    - labels: np.ndarray, Class labels for each sample.</span>
-<span class="sd">    - metric: str, Distance metric (&#39;euclidean&#39;, &#39;manhattan&#39;, etc.).</span>
-<span class="sd">    - n_neg: int, Total number of negatives to identify.</span>
-<span class="sd">    - df_seq: pd.DataFrame, Dataframe to store distance values.</span>
-<span class="sd">    - col_class: str, Column name in df_seq to store class information.</span>
-<span class="sd">    - label_neg, label_pos: int/str, Labels for the negative and positive classes.</span>
-<span class="sd">    - name_neg: str, Prefix for naming identified negatives.</span>
-
-<span class="sd">    Returns:</span>
-<span class="sd">    - new_labels: np.ndarray, Updated array of labels.</span>
-<span class="sd">    - df_seq: pd.DataFrame, Dataframe with updated class information and distances.</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="n">mask_pos</span> <span class="o">=</span> <span class="n">labels</span> <span class="o">==</span> <span class="n">label_pos</span>
-    <span class="n">mask_unl</span> <span class="o">=</span> <span class="n">labels</span> <span class="o">!=</span> <span class="n">label_pos</span>
-    <span class="c1"># Compute the average distances to the positive datapoints</span>
-    <span class="n">avg_dist</span> <span class="o">=</span> <span class="n">pairwise_distances</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="n">mask_pos</span><span class="p">],</span> <span class="n">X</span><span class="p">,</span> <span class="n">metric</span><span class="o">=</span><span class="n">metric</span><span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-    <span class="c1"># Select negatives based on largest average distance to positives</span>
-    <span class="n">top_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">avg_dist</span><span class="p">[</span><span class="n">mask_unl</span><span class="p">])[::</span><span class="o">-</span><span class="mi">1</span><span class="p">][:</span><span class="n">n_neg</span><span class="p">]</span>
-    <span class="n">new_labels</span> <span class="o">=</span> <span class="n">labels</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-    <span class="n">new_labels</span><span class="p">[</span><span class="n">top_indices</span><span class="p">]</span> <span class="o">=</span> <span class="n">label_neg</span>
-    <span class="c1"># Update classes in df_seq and add average distance to positives</span>
-    <span class="k">if</span> <span class="n">df_seq</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">df_seq</span><span class="p">[</span><span class="n">metric</span><span class="p">]</span> <span class="o">=</span> <span class="n">avg_dist</span>
-        <span class="n">df_seq</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">top_indices</span><span class="p">,</span> <span class="n">col_class</span><span class="p">]</span> <span class="o">=</span> <span class="n">name_neg</span>
-    <span class="k">return</span> <span class="n">new_labels</span><span class="p">,</span> <span class="n">df_seq</span>
-
-
-<span class="k">def</span> <span class="nf">_get_neg_via_pca</span><span class="p">(</span><span class="n">X</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">n_components</span><span class="o">=</span><span class="mf">0.8</span><span class="p">,</span> <span class="n">n_neg</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                     <span class="n">df_seq</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">col_class</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                     <span class="n">label_neg</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">label_pos</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">name_neg</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="o">**</span><span class="n">pca_kwargs</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Identify distant samples from positive mean as reliable negatives in PCA-compressed feature spaces.</span>
-
-<span class="sd">    Parameters:</span>
-<span class="sd">    - X: np.ndarray, The input feature matrix of shape (n_samples, n_features).</span>
-<span class="sd">    - labels: np.ndarray, Class labels for each sample.</span>
-<span class="sd">    - n_components: float/int, Number of principal components or the ratio of total explained variance.</span>
-<span class="sd">    - n_neg: int, Total number of negatives to identify.</span>
-<span class="sd">    - df_seq: pd.DataFrame, Dataframe to store PCA values.</span>
-<span class="sd">    - col_class: str, Column name in df_seq to store class information.</span>
-<span class="sd">    - label_neg, label_pos: int/str, Labels for the negative and positive classes.</span>
-<span class="sd">    - name_neg: str, Prefix for naming identified negatives.</span>
-<span class="sd">    - pca_kwargs: dict, Additional keyword arguments for PCA.</span>
-
-<span class="sd">    Returns:</span>
-<span class="sd">    - new_labels: np.ndarray, Updated array of labels.</span>
-<span class="sd">    - df_seq: pd.DataFrame, Dataframe with updated class information.</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="c1"># Principal component analysis</span>
-    <span class="n">pca</span> <span class="o">=</span> <span class="n">PCA</span><span class="p">(</span><span class="n">n_components</span><span class="o">=</span><span class="n">n_components</span><span class="p">,</span> <span class="o">**</span><span class="n">pca_kwargs</span><span class="p">)</span>
-    <span class="n">pca</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="o">.</span><span class="n">T</span><span class="p">)</span>
-    <span class="n">list_exp_var</span> <span class="o">=</span> <span class="n">pca</span><span class="o">.</span><span class="n">explained_variance_ratio_</span>
-    <span class="n">_columns_pca</span> <span class="o">=</span> <span class="p">[</span><span class="sa">f</span><span class="s2">&quot;PC</span><span class="si">{</span><span class="n">n</span><span class="o">+</span><span class="mi">1</span><span class="si">}</span><span class="s2"> (</span><span class="si">{</span><span class="nb">round</span><span class="p">(</span><span class="n">exp_var</span><span class="o">*</span><span class="mi">100</span><span class="p">,</span><span class="w"> </span><span class="mi">1</span><span class="p">)</span><span class="si">}</span><span class="s2">%)&quot;</span> <span class="k">for</span> <span class="n">n</span><span class="p">,</span> <span class="n">exp_var</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">list_exp_var</span><span class="p">)),</span> <span class="n">list_exp_var</span><span class="p">)]</span>
-
-    <span class="c1"># Number of negatives based on explained variance</span>
-    <span class="n">_list_n_neg</span> <span class="o">=</span> <span class="p">[</span><span class="n">math</span><span class="o">.</span><span class="n">ceil</span><span class="p">(</span><span class="n">n_neg</span> <span class="o">*</span> <span class="n">x</span> <span class="o">/</span> <span class="nb">sum</span><span class="p">(</span><span class="n">list_exp_var</span><span class="p">))</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">list_exp_var</span><span class="p">]</span>
-    <span class="n">_list_n_cumsum</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">cumsum</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">_list_n_neg</span><span class="p">))</span>
-    <span class="n">list_n_neg</span> <span class="o">=</span> <span class="p">[</span><span class="n">n</span> <span class="k">for</span> <span class="n">n</span><span class="p">,</span> <span class="n">cs</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">_list_n_neg</span><span class="p">,</span> <span class="n">_list_n_cumsum</span><span class="p">)</span> <span class="k">if</span> <span class="n">cs</span> <span class="o">&lt;=</span> <span class="n">n_neg</span><span class="p">]</span>
-    <span class="k">if</span> <span class="nb">sum</span><span class="p">(</span><span class="n">list_n_neg</span><span class="p">)</span> <span class="o">!=</span> <span class="n">n_neg</span><span class="p">:</span>
-        <span class="n">list_n_neg</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">n_neg</span> <span class="o">-</span> <span class="nb">sum</span><span class="p">(</span><span class="n">list_n_neg</span><span class="p">))</span>
-    <span class="n">columns_pca</span> <span class="o">=</span> <span class="n">_columns_pca</span><span class="p">[</span><span class="mi">0</span><span class="p">:</span><span class="nb">len</span><span class="p">(</span><span class="n">list_n_neg</span><span class="p">)]</span>
-    <span class="n">df_seq</span><span class="p">[</span><span class="n">columns_pca</span><span class="p">]</span> <span class="o">=</span> <span class="n">pca</span><span class="o">.</span><span class="n">components_</span><span class="o">.</span><span class="n">T</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">:</span><span class="nb">len</span><span class="p">(</span><span class="n">columns_pca</span><span class="p">)]</span>
-
-    <span class="c1"># Get mean of positive datafor each component</span>
-    <span class="n">mask_pos</span> <span class="o">=</span> <span class="n">labels</span> <span class="o">==</span> <span class="n">label_pos</span>
-    <span class="n">mask_unl</span> <span class="o">=</span> <span class="n">labels</span> <span class="o">!=</span> <span class="n">label_pos</span>
-    <span class="n">pc_means</span> <span class="o">=</span> <span class="n">df_seq</span><span class="p">[</span><span class="n">mask_pos</span><span class="p">][</span><span class="n">columns_pca</span><span class="p">]</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-
-    <span class="c1"># Select negatives based on absolute difference to mean of positives for each component</span>
-    <span class="n">new_labels</span> <span class="o">=</span> <span class="n">labels</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-    <span class="n">_df</span> <span class="o">=</span> <span class="n">df_seq</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-    <span class="k">for</span> <span class="n">col_pc</span><span class="p">,</span> <span class="n">mean_pc</span><span class="p">,</span> <span class="n">n</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">columns_pca</span><span class="p">,</span> <span class="n">pc_means</span><span class="p">,</span> <span class="n">list_n_neg</span><span class="p">):</span>
-        <span class="n">name_reg_pc</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name_neg</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">col_pc</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39; &#39;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span>
-        <span class="n">col_dif</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">col_pc</span><span class="si">}</span><span class="s2">_abs_dif&quot;</span>
-
-        <span class="c1"># Calculate absolute difference to the mean for each sample in the component</span>
-        <span class="n">_df</span><span class="p">[</span><span class="n">col_dif</span><span class="p">]</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">abs</span><span class="p">(</span><span class="n">df_seq</span><span class="p">[</span><span class="n">col_pc</span><span class="p">]</span> <span class="o">-</span> <span class="n">mean_pc</span><span class="p">)</span>
-
-        <span class="c1"># Sort and take top n indices</span>
-        <span class="n">top_indices</span> <span class="o">=</span> <span class="n">_df</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">mask_unl</span><span class="p">]</span><span class="o">.</span><span class="n">sort_values</span><span class="p">(</span><span class="n">by</span><span class="o">=</span><span class="n">col_dif</span><span class="p">)</span><span class="o">.</span><span class="n">tail</span><span class="p">(</span><span class="n">n</span><span class="p">)</span><span class="o">.</span><span class="n">index</span>
-
-        <span class="c1"># Update labels and masks</span>
-        <span class="n">new_labels</span><span class="p">[</span><span class="n">top_indices</span><span class="p">]</span> <span class="o">=</span> <span class="n">label_neg</span>
-        <span class="n">mask_unl</span><span class="p">[</span><span class="n">top_indices</span><span class="p">]</span> <span class="o">=</span> <span class="kc">False</span>
-
-        <span class="c1"># Update classes in df_seq</span>
-        <span class="k">if</span> <span class="n">df_seq</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">df_seq</span><span class="o">.</span><span class="n">loc</span><span class="p">[</span><span class="n">top_indices</span><span class="p">,</span> <span class="n">col_class</span><span class="p">]</span> <span class="o">=</span> <span class="n">name_reg_pc</span>
-    <span class="k">return</span> <span class="n">new_labels</span><span class="p">,</span> <span class="n">df_seq</span>
-
-
-<div class="viewcode-block" id="dPULearn"><a class="viewcode-back" href="../../../generated/aaanalysis.dPULearn.html#aaanalysis.dPULearn">[docs]</a><span class="k">class</span> <span class="nc">dPULearn</span><span class="p">:</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Deterministic Positive-Unlabeled (dPULearn) model.</span>
-
-<span class="sd">    dPULearn offers a deterministic approach for Positive-Unlabeled (PU) learning. The model primarily employs</span>
-<span class="sd">    Principal Component Analysis (PCA) to reduce the dimensionality of the feature space. Based on the most</span>
-<span class="sd">    informative principal components (PCs), it then iteratively identifies reliable negatives from the set of</span>
-<span class="sd">    unlabeled samples. These reliable negatives are those that are most distant from the positive samples in</span>
-<span class="sd">    the feature space. Alternatively, reliable negatives can also be identified using distance metrics like</span>
-<span class="sd">    Euclidean, Manhattan, or Cosine distance if specified.</span>
-
-<span class="sd">    Parameters</span>
-<span class="sd">    ----------</span>
-<span class="sd">    verbose : bool, default=False</span>
-<span class="sd">        Enable verbose output.</span>
-<span class="sd">    n_components : float or int, default=0.80</span>
-<span class="sd">        Number of components to cover a maximum percentage of total variance when PCA is applied.</span>
-<span class="sd">    pca_kwargs : dict, default=None</span>
-<span class="sd">        Additional keyword arguments to pass to PCA.</span>
-<span class="sd">    metric : {&#39;euclidean&#39;, &#39;manhattan&#39;, &#39;cosine&#39;} or None, default=None</span>
-<span class="sd">        The distance metric to use. If None, PCA-based identification is used.</span>
-<span class="sd">        If a metric is specified, distance-based identification is performed.</span>
-
-<span class="sd">    Attributes</span>
-<span class="sd">    ----------</span>
-<span class="sd">    labels_ : array-like, shape (n_samples,)</span>
-<span class="sd">        Labels of each datapoint.</span>
-
-<span class="sd">    Notes</span>
-<span class="sd">    -----</span>
-<span class="sd">    - The method is inspired by deterministic PU learning techniques and follows</span>
-<span class="sd">        an information-theoretic PU learning approach.</span>
-<span class="sd">    - If `metric` is specified, distance-based identification of reliable negatives is performed.</span>
-<span class="sd">        Otherwise, PCA-based identification is used.</span>
-<span class="sd">    - Cosine metric is recommended in high-dimensional spaces.</span>
-
-<span class="sd">    &quot;&quot;&quot;</span>
-<div class="viewcode-block" id="dPULearn.__init__"><a class="viewcode-back" href="../../../generated/aaanalysis.dPULearn.html#aaanalysis.dPULearn.__init__">[docs]</a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">n_components</span><span class="o">=</span><span class="mf">0.80</span><span class="p">,</span> <span class="n">pca_kwargs</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">metric</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">verbose</span> <span class="o">=</span> <span class="n">verbose</span>
-        <span class="c1"># Arguments for Principal Component Analysis (PCA)-based identification</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">n_components</span> <span class="o">=</span> <span class="n">n_components</span>
-        <span class="k">if</span> <span class="n">pca_kwargs</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">pca_kwargs</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">pca_kwargs</span> <span class="o">=</span> <span class="n">pca_kwargs</span>
-        <span class="c1"># Arguments for distance-based identification</span>
-        <span class="n">_check_metric</span><span class="p">(</span><span class="n">metric</span><span class="o">=</span><span class="n">metric</span><span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">metric</span> <span class="o">=</span> <span class="n">metric</span>
-        <span class="c1"># Output parameters (will be set during model fitting)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">labels_</span> <span class="o">=</span> <span class="kc">None</span></div>
-
-    <span class="c1"># Main method</span>
-<div class="viewcode-block" id="dPULearn.fit"><a class="viewcode-back" href="../../../generated/aaanalysis.dPULearn.html#aaanalysis.dPULearn.fit">[docs]</a>    <span class="k">def</span> <span class="nf">fit</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">n_neg</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">label_pos</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">name_neg</span><span class="o">=</span><span class="s2">&quot;REL_NEG&quot;</span><span class="p">,</span> <span class="n">df_seq</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">col_class</span><span class="o">=</span><span class="s2">&quot;class&quot;</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Fit the dPULearn model to identify reliable negative samples</span>
-<span class="sd">        from the provided feature matrix and labels.</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        X : array-like, shape (n_samples, n_features)</span>
-<span class="sd">            Feature matrix where `n_samples` is the number of samples and `n_features` is the number of features.</span>
-<span class="sd">        labels : array-like, shape (n_samples,), default=None</span>
-<span class="sd">            Array of labels; positive samples should be indicated by `label_pos`.</span>
-<span class="sd">        n_neg : int, default=0</span>
-<span class="sd">            Number of negative samples to identify.</span>
-<span class="sd">        label_pos : int or str, default=1</span>
-<span class="sd">            Label indicating positive samples in the `labels` array.</span>
-<span class="sd">        name_neg : str, default=&quot;REL_NEG&quot;</span>
-<span class="sd">            Name to assign to the newly identified negative samples.</span>
-<span class="sd">        df_seq : DataFrame, default=None, optional</span>
-<span class="sd">            DataFrame containing sequences; will be updated with new negative samples.</span>
-<span class="sd">        col_class : str, default=&quot;class&quot;</span>
-<span class="sd">            Column name in `df_seq` where the class labels are stored.</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        df_seq : DataFrame</span>
-<span class="sd">            DataFrame with the newly identified reliable negatives. Will be None if not provided.</span>
-
-<span class="sd">        Notes</span>
-<span class="sd">        -----</span>
-<span class="sd">        Distance-based identification is used if `metric` is specified during class initialization.</span>
-
-<span class="sd">        Examples</span>
-<span class="sd">        --------</span>
-<span class="sd">        Create small example datafor dPUlearn containg positive (&#39;pos&#39;, 1) and unlabeled (&#39;unl&#39;, 2) data</span>
-
-<span class="sd">        &gt;&gt;&gt; import aaanalysis as aa</span>
-<span class="sd">        &gt;&gt;&gt; import pandas as pd</span>
-<span class="sd">        &gt;&gt;&gt; import numpy as np</span>
-<span class="sd">        &gt;&gt;&gt; X = np.array([[0.2, 0.1], [0.3, 0.2], [0.2, 0.3], [0.5, 0.7]])</span>
-<span class="sd">        &gt;&gt;&gt; labels = np.array([1, 2, 2, 2])</span>
-<span class="sd">        &gt;&gt;&gt; df_seq = pd.DataFrame({</span>
-<span class="sd">        ...     &#39;sequence&#39;: [&#39;ATGC&#39;, &#39;GCTA&#39;, &#39;ACTG&#39;, &#39;TACG&#39;],</span>
-<span class="sd">        ...     &#39;class&#39;: [&#39;pos&#39;, &#39;unl&#39;, &#39;unl&#39;, &#39;unl&#39;]})</span>
-
-<span class="sd">        Use dPULearn in default mode (PC-based identification) and modify df_seq automatically</span>
-
-<span class="sd">        &gt;&gt;&gt; dpul = aa.dPULearn()</span>
-<span class="sd">        &gt;&gt;&gt; n_neg = 2</span>
-<span class="sd">        &gt;&gt;&gt; df_seq = dpul.fit(X=X, df_seq=df_seq, labels=labels, n_neg=n_neg)</span>
-<span class="sd">        &gt;&gt;&gt; labels = dpul.labels_   # Updated labels</span>
-
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_feat_matrix</span><span class="p">(</span><span class="n">X</span><span class="o">=</span><span class="n">X</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="n">labels</span><span class="p">)</span>
-        <span class="n">df_seq</span> <span class="o">=</span> <span class="n">_check_df_seq</span><span class="p">(</span><span class="n">df_seq</span><span class="o">=</span><span class="n">df_seq</span><span class="p">,</span> <span class="n">col_class</span><span class="o">=</span><span class="n">col_class</span><span class="p">)</span>
-        <span class="n">labels</span> <span class="o">=</span> <span class="n">_check_labels</span><span class="p">(</span><span class="n">labels</span><span class="o">=</span><span class="n">labels</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">verbose</span><span class="p">,</span> <span class="n">label_pos</span><span class="o">=</span><span class="n">label_pos</span><span class="p">)</span>
-        <span class="n">label_neg</span> <span class="o">=</span> <span class="n">_get_label_neg</span><span class="p">(</span><span class="n">labels</span><span class="o">=</span><span class="n">labels</span><span class="p">)</span>
-        <span class="n">_check_n_neg</span><span class="p">(</span><span class="n">labels</span><span class="o">=</span><span class="n">labels</span><span class="p">,</span> <span class="n">n_neg</span><span class="o">=</span><span class="n">n_neg</span><span class="p">,</span> <span class="n">label_neg</span><span class="o">=</span><span class="n">label_neg</span><span class="p">,</span> <span class="n">label_pos</span><span class="o">=</span><span class="n">label_pos</span><span class="p">)</span>
-        <span class="c1"># Compute average distance for threshold-based filtering (Yang et al., 2012, 2014; Nan et al. 2017)</span>
-        <span class="n">args</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">X</span><span class="o">=</span><span class="n">X</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="n">labels</span><span class="p">,</span> <span class="n">n_neg</span><span class="o">=</span><span class="n">n_neg</span><span class="p">,</span>
-                    <span class="n">df_seq</span><span class="o">=</span><span class="n">df_seq</span><span class="p">,</span> <span class="n">col_class</span><span class="o">=</span><span class="n">col_class</span><span class="p">,</span>
-                    <span class="n">label_neg</span><span class="o">=</span><span class="n">label_neg</span><span class="p">,</span> <span class="n">label_pos</span><span class="o">=</span><span class="n">label_pos</span><span class="p">,</span> <span class="n">name_neg</span><span class="o">=</span><span class="n">name_neg</span><span class="p">)</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">metric</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">new_labels</span><span class="p">,</span> <span class="n">df_seq</span> <span class="o">=</span> <span class="n">_get_neg_via_distance</span><span class="p">(</span><span class="o">**</span><span class="n">args</span><span class="p">,</span> <span class="n">metric</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">metric</span><span class="p">)</span>
-        <span class="c1"># Identify most far away negatives in PCA compressed feature space</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="n">new_labels</span><span class="p">,</span> <span class="n">df_seq</span> <span class="o">=</span> <span class="n">_get_neg_via_pca</span><span class="p">(</span><span class="o">**</span><span class="n">args</span><span class="p">,</span> <span class="n">n_components</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">n_components</span><span class="p">,</span> <span class="o">**</span><span class="bp">self</span><span class="o">.</span><span class="n">pca_kwargs</span><span class="p">)</span>
-        <span class="c1"># Set new labels</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">labels_</span> <span class="o">=</span> <span class="n">new_labels</span>
-        <span class="k">return</span> <span class="n">df_seq</span></div>
-
-<div class="viewcode-block" id="dPULearn.eval"><a class="viewcode-back" href="../../../generated/aaanalysis.dPULearn.html#aaanalysis.dPULearn.eval">[docs]</a>    <span class="k">def</span> <span class="nf">eval</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span>  <span class="c1"># TODO add evaluation function</span></div></div>
-</pre></div>
-
-           </div>
-          </div>
-          <footer>
-
-  <hr/>
-
-  <div role="contentinfo">
-    <p>&#169; Copyright 2023, Stephan Breimann.</p>
-  </div>
-
-   
-
-</footer>
-        </div>
-      </div>
-    </section>
-  </div>
-  <script>
-      jQuery(function () {
-          SphinxRtdTheme.Navigation.enable(true);
-      });
-  </script> 
-
-</body>
-</html>
\ No newline at end of file
diff --git a/docs/build/html/_modules/aaanalysis/plotting/plotting_functions.html b/docs/build/html/_modules/aaanalysis/plotting/plotting_functions.html
deleted file mode 100644
index 0ddfc6a9..00000000
--- a/docs/build/html/_modules/aaanalysis/plotting/plotting_functions.html
+++ /dev/null
@@ -1,556 +0,0 @@
-<!DOCTYPE html>
-<html class="writer-html5" lang="en" >
-<head>
-  <meta charset="utf-8" />
-  <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-  <title>aaanalysis.plotting.plotting_functions &mdash; AAanalysis</title>
-      <link rel="stylesheet" href="../../../_static/pygments.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/css/theme.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/copybutton.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/plot_directive.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css" type="text/css" />
-      <link rel="stylesheet" href="../../../_static/css/style.css" type="text/css" />
-    <link rel="shortcut icon" href="../../../_static/logo_small.png"/>
-  <!--[if lt IE 9]>
-    <script src="../../../_static/js/html5shiv.min.js"></script>
-  <![endif]-->
-  
-        <script data-url_root="../../../" id="documentation_options" src="../../../_static/documentation_options.js"></script>
-        <script src="../../../_static/jquery.js"></script>
-        <script src="../../../_static/underscore.js"></script>
-        <script src="../../../_static/_sphinx_javascript_frameworks_compat.js"></script>
-        <script src="../../../_static/doctools.js"></script>
-        <script src="../../../_static/sphinx_highlight.js"></script>
-        <script src="../../../_static/clipboard.min.js"></script>
-        <script src="../../../_static/copybutton.js"></script>
-        <script src="../../../_static/design-tabs.js"></script>
-    <script src="../../../_static/js/theme.js"></script>
-    <link rel="index" title="Index" href="../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../search.html" /> 
-</head>
-
-<body class="wy-body-for-nav"> 
-  <div class="wy-grid-for-nav">
-    <nav data-toggle="wy-nav-shift" class="wy-nav-side">
-      <div class="wy-side-scroll">
-        <div class="wy-side-nav-search"  style="background: #343131" >
-            <a href="../../../index.html">
-            <img src="../../../_static/logo_big_trans.png" class="logo" alt="Logo"/>
-          </a>
-              <div class="version">
-                latest
-              </div>
-<div role="search">
-  <form id="rtd-search-form" class="wy-form" action="../../../search.html" method="get">
-    <input type="text" name="q" placeholder="Search docs" />
-    <input type="hidden" name="check_keywords" value="yes" />
-    <input type="hidden" name="area" value="default" />
-  </form>
-</div>
-        </div><div class="wy-menu wy-menu-vertical" data-spy="affix" role="navigation" aria-label="Navigation menu">
-              <p class="caption" role="heading"><span class="caption-text">OVERVIEW</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/introduction.html">Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/usage_principles.html">Usage Principles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/CONTRIBUTING_COPY.html">Contributing</a></li>
-</ul>
-<p class="caption" role="heading"><span class="caption-text">EXAMPLES</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../tutorials.html">Tutorials</a></li>
-</ul>
-<p class="caption" role="heading"><span class="caption-text">REFERENCES</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../api.html">API</a></li>
-</ul>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../../../_index/tables.html">Tables</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../index/references.html">References</a></li>
-</ul>
-
-        </div>
-      </div>
-    </nav>
-
-    <section data-toggle="wy-nav-shift" class="wy-nav-content-wrap"><nav class="wy-nav-top" aria-label="Mobile navigation menu"  style="background: #343131" >
-          <i data-toggle="wy-nav-top" class="fa fa-bars"></i>
-          <a href="../../../index.html">AAanalysis</a>
-      </nav>
-
-      <div class="wy-nav-content">
-        <div class="rst-content">
-          <div role="navigation" aria-label="Page navigation">
-  <ul class="wy-breadcrumbs">
-      <li><a href="../../../index.html" class="icon icon-home"></a></li>
-          <li class="breadcrumb-item"><a href="../../index.html">Module code</a></li>
-      <li class="breadcrumb-item active">aaanalysis.plotting.plotting_functions</li>
-      <li class="wy-breadcrumbs-aside">
-      </li>
-  </ul>
-  <hr/>
-</div>
-          <div role="main" class="document" itemscope="itemscope" itemtype="http://schema.org/Article">
-           <div itemprop="articleBody">
-             
-  <h1>Source code for aaanalysis.plotting.plotting_functions</h1><div class="highlight"><pre>
-<span></span><span class="ch">#! /usr/bin/python3</span>
-<span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">Default plotting functions</span>
-<span class="sd">&quot;&quot;&quot;</span>
-<span class="kn">import</span> <span class="nn">seaborn</span> <span class="k">as</span> <span class="nn">sns</span>
-<span class="kn">import</span> <span class="nn">matplotlib</span> <span class="k">as</span> <span class="nn">mpl</span>
-<span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
-<span class="kn">import</span> <span class="nn">aaanalysis.utils</span> <span class="k">as</span> <span class="nn">ut</span>
-
-
-
-<span class="n">LIST_AA_COLOR_PALETTES</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;FEAT&quot;</span><span class="p">,</span> <span class="s2">&quot;SHAP&quot;</span><span class="p">,</span> <span class="s2">&quot;GGPLOT&quot;</span><span class="p">]</span>
-<span class="n">LIST_AA_COLOR_DICTS</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;DICT_SCALE_CAT&quot;</span><span class="p">,</span> <span class="s2">&quot;DICT_COLOR&quot;</span><span class="p">]</span>
-<span class="n">LIST_AA_COLORS</span> <span class="o">=</span> <span class="n">LIST_AA_COLOR_PALETTES</span> <span class="o">+</span> <span class="n">LIST_AA_COLOR_DICTS</span>
-
-<span class="n">LIST_FONTS</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;Arial&#39;</span><span class="p">,</span> <span class="s1">&#39;Avant Garde&#39;</span><span class="p">,</span> <span class="s1">&#39;Bitstream Vera Sans&#39;</span><span class="p">,</span> <span class="s1">&#39;Computer Modern Sans Serif&#39;</span><span class="p">,</span> <span class="s1">&#39;DejaVu Sans&#39;</span><span class="p">,</span>
-              <span class="s1">&#39;Geneva&#39;</span><span class="p">,</span> <span class="s1">&#39;Helvetica&#39;</span><span class="p">,</span> <span class="s1">&#39;Lucid&#39;</span><span class="p">,</span> <span class="s1">&#39;Lucida Grande&#39;</span><span class="p">,</span> <span class="s1">&#39;Verdana&#39;</span><span class="p">]</span>
-
-
-<span class="c1"># Helper functions</span>
-<span class="k">def</span> <span class="nf">check_font_style</span><span class="p">(</span><span class="n">font</span><span class="o">=</span><span class="s2">&quot;Arial&quot;</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="n">font</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">LIST_FONTS</span><span class="p">:</span>
-        <span class="n">error_message</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;&#39;font&#39; (</span><span class="si">{</span><span class="n">font</span><span class="si">}</span><span class="s2">) not in recommended fonts: </span><span class="si">{</span><span class="n">LIST_FONTS</span><span class="si">}</span><span class="s2">. Set font manually by:&quot;</span> \
-                        <span class="sa">f</span><span class="s2">&quot;</span><span class="se">\n\t</span><span class="s2">plt.rcParams[&#39;font.sans-serif&#39;] = &#39;</span><span class="si">{</span><span class="n">font</span><span class="si">}</span><span class="s2">&#39;&quot;</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">error_message</span><span class="p">)</span>
-
-
-<span class="k">def</span> <span class="nf">check_fig_format</span><span class="p">(</span><span class="n">fig_format</span><span class="o">=</span><span class="s2">&quot;pdf&quot;</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span>
-    <span class="n">list_fig_formats</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;eps&#39;</span><span class="p">,</span> <span class="s1">&#39;jpg&#39;</span><span class="p">,</span> <span class="s1">&#39;jpeg&#39;</span><span class="p">,</span> <span class="s1">&#39;pdf&#39;</span><span class="p">,</span> <span class="s1">&#39;pgf&#39;</span><span class="p">,</span> <span class="s1">&#39;png&#39;</span><span class="p">,</span> <span class="s1">&#39;ps&#39;</span><span class="p">,</span>
-                        <span class="s1">&#39;raw&#39;</span><span class="p">,</span> <span class="s1">&#39;rgba&#39;</span><span class="p">,</span> <span class="s1">&#39;svg&#39;</span><span class="p">,</span> <span class="s1">&#39;svgz&#39;</span><span class="p">,</span> <span class="s1">&#39;tif&#39;</span><span class="p">,</span> <span class="s1">&#39;tiff&#39;</span><span class="p">,</span> <span class="s1">&#39;webp&#39;</span><span class="p">]</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_str</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;fig_format&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">fig_format</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">fig_format</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">list_fig_formats</span><span class="p">:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;&#39;fig_format&#39; should be one of following: </span><span class="si">{</span><span class="n">list_fig_formats</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-
-
-<span class="k">def</span> <span class="nf">check_grid_axis</span><span class="p">(</span><span class="n">grid_axis</span><span class="o">=</span><span class="s2">&quot;y&quot;</span><span class="p">):</span>
-    <span class="n">list_grid_axis</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;y&quot;</span><span class="p">,</span> <span class="s2">&quot;x&quot;</span><span class="p">,</span> <span class="s2">&quot;both&quot;</span><span class="p">]</span>
-    <span class="k">if</span> <span class="n">grid_axis</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">list_grid_axis</span><span class="p">:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;&#39;grid_axis&#39; (</span><span class="si">{</span><span class="n">grid_axis</span><span class="si">}</span><span class="s2">) should be one of following: </span><span class="si">{</span><span class="n">list_grid_axis</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-
-
-<span class="k">def</span> <span class="nf">check_cats</span><span class="p">(</span><span class="n">list_cat</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">dict_color</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_dict</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;dict_color&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">dict_color</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">labels</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="k">if</span> <span class="n">list_cat</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">list_cat</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">labels</span><span class="p">):</span>
-                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Length of &#39;list_cat&#39; (</span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">list_cat</span><span class="p">)</span><span class="si">}</span><span class="s2">) and &#39;labels&#39; (</span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">labels</span><span class="p">)</span><span class="si">}</span><span class="s2">) must match&quot;</span><span class="p">)</span>
-        <span class="k">elif</span> <span class="nb">len</span><span class="p">(</span><span class="n">dict_color</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">len</span><span class="p">(</span><span class="n">labels</span><span class="p">):</span>
-            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Length of &#39;dict_color&#39; (</span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">dict_color</span><span class="p">)</span><span class="si">}</span><span class="s2">) and &#39;labels&#39; (</span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">labels</span><span class="p">)</span><span class="si">}</span><span class="s2">) must match&quot;</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">list_cat</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">list_cat</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">dict_color</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span>
-    <span class="k">else</span><span class="p">:</span>
-        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;&#39;list_cat&#39; and &#39;dict_color&#39; should not be None&quot;</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">list_cat</span>
-
-
-<span class="c1"># Get color maps</span>
-<span class="k">def</span> <span class="nf">_get_shap_cmap</span><span class="p">(</span><span class="n">n_colors</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span> <span class="n">facecolor_dark</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Generate a diverging color map for feature values.&quot;&quot;&quot;</span>
-    <span class="n">n</span> <span class="o">=</span> <span class="mi">20</span>
-    <span class="n">cmap_low</span> <span class="o">=</span> <span class="n">sns</span><span class="o">.</span><span class="n">light_palette</span><span class="p">(</span><span class="n">ut</span><span class="o">.</span><span class="n">COLOR_SHAP_NEG</span><span class="p">,</span> <span class="nb">input</span><span class="o">=</span><span class="s2">&quot;hex&quot;</span><span class="p">,</span> <span class="n">reverse</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">n_colors</span><span class="o">=</span><span class="nb">int</span><span class="p">(</span><span class="n">n_colors</span><span class="o">/</span><span class="mi">2</span><span class="p">)</span><span class="o">+</span><span class="n">n</span><span class="p">)</span>
-    <span class="n">cmap_high</span> <span class="o">=</span> <span class="n">sns</span><span class="o">.</span><span class="n">light_palette</span><span class="p">(</span><span class="n">ut</span><span class="o">.</span><span class="n">COLOR_SHAP_POS</span><span class="p">,</span> <span class="nb">input</span><span class="o">=</span><span class="s2">&quot;hex&quot;</span><span class="p">,</span> <span class="n">n_colors</span><span class="o">=</span><span class="nb">int</span><span class="p">(</span><span class="n">n_colors</span><span class="o">/</span><span class="mi">2</span><span class="p">)</span><span class="o">+</span><span class="n">n</span><span class="p">)</span>
-    <span class="n">c_middle</span> <span class="o">=</span> <span class="p">[(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">)]</span> <span class="k">if</span> <span class="n">facecolor_dark</span> <span class="k">else</span> <span class="p">[</span><span class="n">cmap_low</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]]</span>
-    <span class="n">cmap</span> <span class="o">=</span> <span class="n">cmap_low</span><span class="p">[</span><span class="mi">0</span><span class="p">:</span><span class="o">-</span><span class="n">n</span><span class="p">]</span> <span class="o">+</span> <span class="n">c_middle</span> <span class="o">+</span> <span class="n">cmap_high</span><span class="p">[</span><span class="n">n</span><span class="p">:]</span>
-    <span class="k">return</span> <span class="n">cmap</span>
-
-
-<span class="k">def</span> <span class="nf">_get_feat_cmap</span><span class="p">(</span><span class="n">n_colors</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span> <span class="n">facecolor_dark</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Generate a diverging color map for feature values.&quot;&quot;&quot;</span>
-    <span class="n">n</span> <span class="o">=</span> <span class="mi">5</span>
-    <span class="n">cmap</span> <span class="o">=</span> <span class="n">sns</span><span class="o">.</span><span class="n">color_palette</span><span class="p">(</span><span class="s2">&quot;RdBu_r&quot;</span><span class="p">,</span> <span class="n">n_colors</span><span class="o">=</span><span class="n">n_colors</span> <span class="o">+</span> <span class="n">n</span> <span class="o">*</span> <span class="mi">2</span><span class="p">)</span>
-    <span class="n">cmap_low</span><span class="p">,</span> <span class="n">cmap_high</span> <span class="o">=</span> <span class="n">cmap</span><span class="p">[</span><span class="mi">0</span><span class="p">:</span><span class="nb">int</span><span class="p">((</span><span class="n">n_colors</span> <span class="o">+</span> <span class="n">n</span> <span class="o">*</span> <span class="mi">2</span><span class="p">)</span> <span class="o">/</span> <span class="mi">2</span><span class="p">)],</span> <span class="n">cmap</span><span class="p">[</span><span class="nb">int</span><span class="p">((</span><span class="n">n_colors</span> <span class="o">+</span> <span class="n">n</span> <span class="o">*</span> <span class="mi">2</span><span class="p">)</span> <span class="o">/</span> <span class="mi">2</span><span class="p">):]</span>
-    <span class="n">c_middle</span> <span class="o">=</span> <span class="p">[(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">)]</span> <span class="k">if</span> <span class="n">facecolor_dark</span> <span class="k">else</span> <span class="p">[</span><span class="n">cmap_low</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]]</span>
-    <span class="n">cmap</span> <span class="o">=</span> <span class="n">cmap_low</span><span class="p">[</span><span class="mi">0</span><span class="p">:</span><span class="o">-</span><span class="n">n</span><span class="p">]</span> <span class="o">+</span> <span class="n">c_middle</span> <span class="o">+</span> <span class="n">cmap_high</span><span class="p">[</span><span class="n">n</span><span class="p">:]</span>
-    <span class="k">return</span> <span class="n">cmap</span>
-
-
-<span class="k">def</span> <span class="nf">_get_ggplot_cmap</span><span class="p">(</span><span class="n">n_colors</span><span class="o">=</span><span class="mi">100</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Generate a circular GGplot color palette.&quot;&quot;&quot;</span>
-    <span class="n">cmap</span> <span class="o">=</span> <span class="n">sns</span><span class="o">.</span><span class="n">color_palette</span><span class="p">(</span><span class="s2">&quot;husl&quot;</span><span class="p">,</span> <span class="n">n_colors</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">cmap</span>
-
-
-<span class="k">def</span> <span class="nf">_get_default_colors</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">n_colors</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span> <span class="n">facecolor_dark</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Retrieve default color maps based on palette name.&quot;&quot;&quot;</span>
-    <span class="n">args</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">n_colors</span><span class="o">=</span><span class="n">n_colors</span><span class="p">,</span> <span class="n">facecolor_dark</span><span class="o">=</span><span class="n">facecolor_dark</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">name</span> <span class="o">==</span> <span class="s2">&quot;SHAP&quot;</span><span class="p">:</span>
-        <span class="k">return</span> <span class="n">_get_shap_cmap</span><span class="p">(</span><span class="o">**</span><span class="n">args</span><span class="p">)</span>
-    <span class="k">elif</span> <span class="n">name</span> <span class="o">==</span> <span class="s2">&quot;FEAT&quot;</span><span class="p">:</span>
-        <span class="k">return</span> <span class="n">_get_feat_cmap</span><span class="p">(</span><span class="o">**</span><span class="n">args</span><span class="p">)</span>
-    <span class="k">elif</span> <span class="n">name</span> <span class="o">==</span> <span class="s2">&quot;GGPLOT&quot;</span><span class="p">:</span>
-        <span class="k">return</span> <span class="n">_get_ggplot_cmap</span><span class="p">(</span><span class="n">n_colors</span><span class="o">=</span><span class="n">n_colors</span><span class="p">)</span>
-
-
-<span class="k">def</span> <span class="nf">_get_cmap_with_gap</span><span class="p">(</span><span class="n">n_colors</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span> <span class="n">color_pos</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">color_neg</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">color_center</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">pct_gap</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">pct_center</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                       <span class="nb">input</span><span class="o">=</span><span class="s2">&quot;hex&quot;</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Generate a custom color map with a gap.&quot;&quot;&quot;</span>
-    <span class="n">n_gap</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n_colors</span><span class="o">*</span><span class="n">pct_gap</span><span class="o">/</span><span class="mi">2</span><span class="p">)</span>
-    <span class="n">cmap_pos</span> <span class="o">=</span> <span class="n">sns</span><span class="o">.</span><span class="n">light_palette</span><span class="p">(</span><span class="n">color_pos</span><span class="p">,</span> <span class="nb">input</span><span class="o">=</span><span class="nb">input</span><span class="p">,</span> <span class="n">n_colors</span><span class="o">=</span><span class="nb">int</span><span class="p">(</span><span class="n">n_colors</span><span class="o">/</span><span class="mi">2</span><span class="p">)</span><span class="o">+</span><span class="n">n_gap</span><span class="p">)</span>
-    <span class="n">cmap_neg</span> <span class="o">=</span> <span class="n">sns</span><span class="o">.</span><span class="n">light_palette</span><span class="p">(</span><span class="n">color_neg</span><span class="p">,</span> <span class="nb">input</span><span class="o">=</span><span class="nb">input</span><span class="p">,</span> <span class="n">reverse</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">n_colors</span><span class="o">=</span><span class="nb">int</span><span class="p">(</span><span class="n">n_colors</span><span class="o">/</span><span class="mi">2</span><span class="p">)</span><span class="o">+</span><span class="n">n_gap</span><span class="p">)</span>
-    <span class="n">color_center</span> <span class="o">=</span> <span class="p">[</span><span class="n">cmap_neg</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]]</span> <span class="k">if</span> <span class="n">color_center</span> <span class="ow">is</span> <span class="kc">None</span> <span class="k">else</span> <span class="n">color_center</span>
-    <span class="n">color_center</span> <span class="o">=</span> <span class="p">[</span><span class="n">color_center</span><span class="p">]</span> <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">color_center</span><span class="p">)</span> <span class="ow">is</span> <span class="nb">str</span> <span class="k">else</span> <span class="n">color_center</span>
-    <span class="k">if</span> <span class="n">pct_center</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">cmap</span> <span class="o">=</span> <span class="n">cmap_neg</span><span class="p">[</span><span class="mi">0</span><span class="p">:</span><span class="o">-</span><span class="n">n_gap</span><span class="p">]</span> <span class="o">+</span> <span class="n">color_center</span> <span class="o">+</span> <span class="n">cmap_pos</span><span class="p">[</span><span class="n">n_gap</span><span class="p">:]</span>
-    <span class="k">else</span><span class="p">:</span>
-        <span class="n">n_center</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n_colors</span> <span class="o">*</span> <span class="n">pct_center</span><span class="p">)</span>
-        <span class="n">n_gap</span> <span class="o">+=</span> <span class="nb">int</span><span class="p">(</span><span class="n">n_center</span><span class="o">/</span><span class="mi">2</span><span class="p">)</span>
-        <span class="n">cmap</span> <span class="o">=</span> <span class="n">cmap_neg</span><span class="p">[</span><span class="mi">0</span><span class="p">:</span><span class="o">-</span><span class="n">n_gap</span><span class="p">]</span> <span class="o">+</span> <span class="n">color_center</span> <span class="o">*</span> <span class="n">n_center</span> <span class="o">+</span> <span class="n">cmap_pos</span><span class="p">[</span><span class="n">n_gap</span><span class="p">:]</span>
-    <span class="k">return</span> <span class="n">cmap</span>
-
-
-<span class="c1"># Default plotting function</span>
-<div class="viewcode-block" id="plot_get_cmap"><a class="viewcode-back" href="../../../generated/aaanalysis.plot_get_cmap.html#aaanalysis.plot_get_cmap">[docs]</a><span class="k">def</span> <span class="nf">plot_get_cmap</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">n_colors</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span> <span class="n">facecolor_dark</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-                  <span class="n">color_pos</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">color_neg</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">color_center</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                  <span class="nb">input</span><span class="o">=</span><span class="s2">&quot;hex&quot;</span><span class="p">,</span> <span class="n">pct_gap</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">pct_center</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Retrieve color maps or color dictionaries specified for AAanalysis.</span>
-
-<span class="sd">    Parameters</span>
-<span class="sd">    ----------</span>
-<span class="sd">    name : str, optional</span>
-<span class="sd">        The name of the color palette to use in AAanalysis. Options include:</span>
-<span class="sd">         - &#39;SHAP&#39;, &#39;FEAT&#39;, &#39;GGPLOT&#39;: Return color maps for SHAP plots, CPP feature maps/heatmaps,</span>
-<span class="sd">            and datagrouping as in GGplot, respectively.</span>
-<span class="sd">         - &#39;DICT_COLOR&#39;, &#39;DICT_SCALE_CAT&#39;: Return default color dictionaries for plots (e.g., bars in CPPPlot.profile)</span>
-<span class="sd">            and scale categories (e.g., CPPPlot.heatmap), respectively.</span>
-<span class="sd">    n_colors : int, default=100</span>
-<span class="sd">        Number of colors in the color map.</span>
-<span class="sd">    facecolor_dark : bool, default=False</span>
-<span class="sd">        Whether to use a dark face color for &#39;SHAP&#39; and &#39;FEAT&#39;.</span>
-<span class="sd">    color_pos : str, optional</span>
-<span class="sd">        Hex code for the positive color.</span>
-<span class="sd">    color_neg : str, optional</span>
-<span class="sd">        Hex code for the negative color.</span>
-<span class="sd">    color_center : str or list, optional</span>
-<span class="sd">        Hex code or list for the center color.</span>
-<span class="sd">    input : str, {&#39;rgb&#39;, &#39;hls&#39;, &#39;husl&#39;, &#39;xkcd&#39;}</span>
-<span class="sd">        Color space to interpret the input color. The first three options</span>
-<span class="sd">        apply to tuple inputs and the latter applies to string inputs.</span>
-<span class="sd">    pct_gap : int, default=10</span>
-<span class="sd">        Percentage size of the gap between color ranges.</span>
-<span class="sd">    pct_center : float, optional</span>
-<span class="sd">        Percentage size of the center color in the map.</span>
-
-<span class="sd">    Returns</span>
-<span class="sd">    -------</span>
-<span class="sd">    cmap : list or dict</span>
-<span class="sd">        If &#39;name&#39; parameter is &#39;SHAP&#39;, &#39;FEAT&#39;, or &#39;GGPLOT&#39;, a list of colors specified for AAanalysis will be returned.</span>
-<span class="sd">        If &#39;name&#39; parameter is None, a list of colors based on provided colors</span>
-
-<span class="sd">    See Also</span>
-<span class="sd">    --------</span>
-<span class="sd">    sns.color_palette : Function to generate a color palette in seaborn.</span>
-<span class="sd">    sns.light_palette : Function to generate a lighter color palette in seaborn.</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="c1"># TODO check color dict name</span>
-    <span class="k">if</span> <span class="n">name</span> <span class="ow">in</span> <span class="n">LIST_AA_COLOR_PALETTES</span><span class="p">:</span>
-        <span class="n">cmap</span> <span class="o">=</span> <span class="n">_get_default_colors</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">,</span> <span class="n">n_colors</span><span class="o">=</span><span class="n">n_colors</span><span class="p">,</span> <span class="n">facecolor_dark</span><span class="o">=</span><span class="n">facecolor_dark</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">cmap</span>
-    <span class="n">cmap</span> <span class="o">=</span> <span class="n">_get_cmap_with_gap</span><span class="p">(</span><span class="n">n_colors</span><span class="o">=</span><span class="n">n_colors</span><span class="p">,</span> <span class="n">color_pos</span><span class="o">=</span><span class="n">color_pos</span><span class="p">,</span> <span class="n">color_neg</span><span class="o">=</span><span class="n">color_neg</span><span class="p">,</span>
-                              <span class="n">color_center</span><span class="o">=</span><span class="n">color_center</span><span class="p">,</span> <span class="n">pct_gap</span><span class="o">=</span><span class="n">pct_gap</span><span class="p">,</span> <span class="n">pct_center</span><span class="o">=</span><span class="n">pct_center</span><span class="p">,</span>
-                              <span class="nb">input</span><span class="o">=</span><span class="nb">input</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">cmap</span></div>
-
-
-<div class="viewcode-block" id="plot_get_cdict"><a class="viewcode-back" href="../../../generated/aaanalysis.plot_get_cdict.html#aaanalysis.plot_get_cdict">[docs]</a><span class="k">def</span> <span class="nf">plot_get_cdict</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Retrieve color dictionaries specified for AAanalysis.</span>
-
-<span class="sd">    Parameters</span>
-<span class="sd">    ----------</span>
-<span class="sd">    name : str, {&#39;DICT_COLOR&#39;, &#39;DICT_SCALE_CAT&#39;}</span>
-<span class="sd">        The name of default color dictionaries for plots (e.g., bars in CPPPlot.profile)</span>
-<span class="sd">        and scale categories (e.g., CPPPlot.heatmap), respectively.</span>
-
-<span class="sd">    Returns</span>
-<span class="sd">    -------</span>
-<span class="sd">    cmap :  dict</span>
-<span class="sd">       Specific AAanalysis color dictionary.</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="c1"># TODO check color dict name</span>
-    <span class="n">color_dict</span> <span class="o">=</span> <span class="n">ut</span><span class="o">.</span><span class="n">DICT_COLOR</span> <span class="k">if</span> <span class="n">name</span> <span class="o">==</span> <span class="s2">&quot;DICT_COLORS&quot;</span> <span class="k">else</span> <span class="n">ut</span><span class="o">.</span><span class="n">DICT_COLOR_CAT</span>
-    <span class="k">return</span> <span class="n">color_dict</span></div>
-
-
-<div class="viewcode-block" id="plot_settings"><a class="viewcode-back" href="../../../generated/aaanalysis.plot_settings.html#aaanalysis.plot_settings">[docs]</a><span class="k">def</span> <span class="nf">plot_settings</span><span class="p">(</span><span class="n">fig_format</span><span class="o">=</span><span class="s2">&quot;pdf&quot;</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">grid</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">grid_axis</span><span class="o">=</span><span class="s2">&quot;y&quot;</span><span class="p">,</span>
-                  <span class="n">font_scale</span><span class="o">=</span><span class="mf">0.7</span><span class="p">,</span> <span class="n">font</span><span class="o">=</span><span class="s2">&quot;Arial&quot;</span><span class="p">,</span>
-                  <span class="n">change_size</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">weight_bold</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">adjust_elements</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-                  <span class="n">short_ticks</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">no_ticks</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-                  <span class="n">no_ticks_y</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">short_ticks_y</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">no_ticks_x</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">short_ticks_x</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Configure general settings for plot visualization with various customization options.</span>
-
-<span class="sd">    Parameters</span>
-<span class="sd">    ----------</span>
-<span class="sd">    fig_format : str, default=&#39;pdf&#39;</span>
-<span class="sd">        Specifies the file format for saving the plot.</span>
-<span class="sd">    verbose : bool, default=False</span>
-<span class="sd">        If True, enables verbose output.</span>
-<span class="sd">    grid : bool, default=False</span>
-<span class="sd">        If True, makes the grid visible.</span>
-<span class="sd">    grid_axis : str, default=&#39;y&#39;</span>
-<span class="sd">        Choose the axis (&#39;y&#39;, &#39;x&#39;, &#39;both&#39;) to apply the grid to.</span>
-<span class="sd">    font_scale : float, default=0.7</span>
-<span class="sd">        Sets the scale for font sizes in the plot.</span>
-<span class="sd">    font : str, default=&#39;Arial&#39;</span>
-<span class="sd">        Name of sans-serif font (e.g., &#39;Arial&#39;, &#39;Verdana&#39;, &#39;Helvetica&#39;, &#39;DejaVu Sans&#39;)</span>
-<span class="sd">    change_size : bool, default=True</span>
-<span class="sd">        If True, adjusts the size of plot elements.</span>
-<span class="sd">    weight_bold : bool, default=True</span>
-<span class="sd">        If True, text elements appear in bold.</span>
-<span class="sd">    adjust_elements : bool, default=True</span>
-<span class="sd">        If True, makes additional visual and layout adjustments to the plot.</span>
-<span class="sd">    short_ticks : bool, default=False</span>
-<span class="sd">        If True, uses short tick marks.</span>
-<span class="sd">    no_ticks : bool, default=False</span>
-<span class="sd">        If True, removes all tick marks.</span>
-<span class="sd">    no_ticks_y : bool, default=False</span>
-<span class="sd">        If True, removes tick marks on the y-axis.</span>
-<span class="sd">    short_ticks_y : bool, default=False</span>
-<span class="sd">        If True, uses short tick marks on the y-axis.</span>
-<span class="sd">    no_ticks_x : bool, default=False</span>
-<span class="sd">        If True, removes tick marks on the x-axis.</span>
-<span class="sd">    short_ticks_x : bool, default=False</span>
-<span class="sd">        If True, uses short tick marks on the x-axis.</span>
-
-<span class="sd">    Notes</span>
-<span class="sd">    -----</span>
-<span class="sd">    This function modifies the global settings of Matplotlib and Seaborn libraries.</span>
-
-<span class="sd">    Examples</span>
-<span class="sd">    --------</span>
-<span class="sd">    &gt;&gt;&gt; import aaanalysis as aa</span>
-<span class="sd">    &gt;&gt;&gt; aa.plot_settings(fig_format=&quot;pdf&quot;, font_scale=1.0, weight_bold=False)</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="c1"># Check input</span>
-    <span class="n">check_fig_format</span><span class="p">(</span><span class="n">fig_format</span><span class="o">=</span><span class="n">fig_format</span><span class="p">)</span>
-    <span class="n">check_font_style</span><span class="p">(</span><span class="n">font</span><span class="o">=</span><span class="n">font</span><span class="p">)</span>
-    <span class="n">check_grid_axis</span><span class="p">(</span><span class="n">grid_axis</span><span class="o">=</span><span class="n">grid_axis</span><span class="p">)</span>
-    <span class="n">args_bool</span> <span class="o">=</span> <span class="p">{</span><span class="s2">&quot;verbose&quot;</span><span class="p">:</span> <span class="n">verbose</span><span class="p">,</span> <span class="s2">&quot;grid&quot;</span><span class="p">:</span> <span class="n">grid</span><span class="p">,</span> <span class="s2">&quot;change_size&quot;</span><span class="p">:</span> <span class="n">change_size</span><span class="p">,</span> <span class="s2">&quot;weight_bold&quot;</span><span class="p">:</span> <span class="n">weight_bold</span><span class="p">,</span>
-                 <span class="s2">&quot;adjust_elements&quot;</span><span class="p">:</span> <span class="n">adjust_elements</span><span class="p">,</span>
-                 <span class="s2">&quot;short_ticks&quot;</span><span class="p">:</span> <span class="n">short_ticks</span><span class="p">,</span> <span class="s2">&quot;no_ticks&quot;</span><span class="p">:</span> <span class="n">no_ticks</span><span class="p">,</span> <span class="s2">&quot;no_ticks_y&quot;</span><span class="p">:</span> <span class="n">no_ticks_y</span><span class="p">,</span>
-                 <span class="s2">&quot;short_ticks_y&quot;</span><span class="p">:</span> <span class="n">short_ticks_y</span><span class="p">,</span> <span class="s2">&quot;no_ticks_x&quot;</span><span class="p">:</span> <span class="n">no_ticks_x</span><span class="p">,</span> <span class="s2">&quot;short_ticks_x&quot;</span><span class="p">:</span> <span class="n">short_ticks_x</span><span class="p">}</span>
-    <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">args_bool</span><span class="p">:</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_bool</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="n">key</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">args_bool</span><span class="p">[</span><span class="n">key</span><span class="p">])</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;font_scale&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">font_scale</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-
-    <span class="c1"># Set embedded fonts in PDF</span>
-    <span class="n">mpl</span><span class="o">.</span><span class="n">rcParams</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">mpl</span><span class="o">.</span><span class="n">rcParamsDefault</span><span class="p">)</span>
-    <span class="n">mpl</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;pdf.fonttype&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">42</span>
-    <span class="n">mpl</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;pdf.fonttype&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">42</span>
-    <span class="k">if</span> <span class="n">verbose</span><span class="p">:</span>
-        <span class="nb">print</span><span class="p">(</span><span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="o">.</span><span class="n">keys</span><span class="p">)</span>    <span class="c1"># Print all plot settings that can be modified in general</span>
-    <span class="k">if</span> <span class="ow">not</span> <span class="n">change_size</span><span class="p">:</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;font.family&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;sans-serif&quot;</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;font.sans-serif&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">font</span>
-        <span class="n">mpl</span><span class="o">.</span><span class="n">rc</span><span class="p">(</span><span class="s1">&#39;font&#39;</span><span class="p">,</span> <span class="o">**</span><span class="p">{</span><span class="s1">&#39;family&#39;</span><span class="p">:</span> <span class="n">font</span><span class="p">})</span>
-        <span class="k">return</span>
-    <span class="n">sns</span><span class="o">.</span><span class="n">set_context</span><span class="p">(</span><span class="s2">&quot;talk&quot;</span><span class="p">,</span> <span class="n">font_scale</span><span class="o">=</span><span class="n">font_scale</span><span class="p">)</span>  <span class="c1"># Font settings https://matplotlib.org/3.1.1/tutorials/text/text_props.html</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;font.family&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;sans-serif&quot;</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;font.sans-serif&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">font</span>
-    <span class="k">if</span> <span class="n">weight_bold</span><span class="p">:</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;axes.labelweight&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;bold&quot;</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;axes.titleweight&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;bold&quot;</span>
-    <span class="k">else</span><span class="p">:</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;axes.linewidth&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">1</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;xtick.major.width&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mf">0.8</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;xtick.minor.width&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mf">0.6</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;ytick.major.width&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mf">0.8</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;ytick.minor.width&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mf">0.6</span>
-    <span class="k">if</span> <span class="n">short_ticks</span><span class="p">:</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;xtick.major.size&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mf">3.5</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;xtick.minor.size&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">2</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;ytick.major.size&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mf">3.5</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;ytick.minor.size&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">2</span>
-    <span class="k">if</span> <span class="n">short_ticks_x</span><span class="p">:</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;xtick.major.size&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mf">3.5</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;xtick.minor.size&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">2</span>
-    <span class="k">if</span> <span class="n">short_ticks_y</span><span class="p">:</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;ytick.major.size&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mf">3.5</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;ytick.minor.size&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">2</span>
-    <span class="k">if</span> <span class="n">no_ticks</span><span class="p">:</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;xtick.major.size&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;xtick.minor.size&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;ytick.major.size&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;ytick.minor.size&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
-    <span class="k">if</span> <span class="n">no_ticks_x</span><span class="p">:</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;xtick.major.size&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;xtick.minor.size&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
-    <span class="k">if</span> <span class="n">no_ticks_y</span><span class="p">:</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;ytick.major.size&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;ytick.minor.size&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">0</span>
-
-    <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;axes.labelsize&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">17</span> <span class="c1">#13.5</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;axes.titlesize&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mf">16.5</span> <span class="c1">#15</span>
-    <span class="k">if</span> <span class="n">fig_format</span> <span class="o">==</span> <span class="s2">&quot;pdf&quot;</span><span class="p">:</span>
-        <span class="n">mpl</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s1">&#39;pdf.fonttype&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">42</span>
-    <span class="k">elif</span> <span class="s2">&quot;svg&quot;</span> <span class="ow">in</span> <span class="n">fig_format</span><span class="p">:</span>
-        <span class="n">mpl</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s1">&#39;svg.fonttype&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;none&#39;</span>
-    <span class="n">font</span> <span class="o">=</span> <span class="p">{</span><span class="s1">&#39;family&#39;</span><span class="p">:</span> <span class="n">font</span><span class="p">,</span> <span class="s2">&quot;weight&quot;</span><span class="p">:</span> <span class="s2">&quot;bold&quot;</span><span class="p">}</span> <span class="k">if</span> <span class="n">weight_bold</span> <span class="k">else</span> <span class="p">{</span><span class="s2">&quot;family&quot;</span><span class="p">:</span> <span class="n">font</span><span class="p">}</span>
-    <span class="n">mpl</span><span class="o">.</span><span class="n">rc</span><span class="p">(</span><span class="s1">&#39;font&#39;</span><span class="p">,</span> <span class="o">**</span><span class="n">font</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">adjust_elements</span><span class="p">:</span>
-        <span class="c1"># Error bars</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;errorbar.capsize&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">10</span>   <span class="c1"># https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.errorbar.html</span>
-        <span class="c1"># Grid</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;axes.grid.axis&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">grid_axis</span>  <span class="c1"># &#39;y&#39;, &#39;x&#39;, &#39;both&#39;</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;axes.grid&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">grid</span>
-        <span class="c1"># Legend</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;legend.frameon&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">False</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;legend.fontsize&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;medium&quot;</span> <span class="c1">#&quot;x-small&quot;</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s2">&quot;legend.loc&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;upper right&#39;</span>  <span class="c1"># https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.legend.html</span></div>
-
-
-<div class="viewcode-block" id="plot_gcfs"><a class="viewcode-back" href="../../../generated/aaanalysis.plot_gcfs.html#aaanalysis.plot_gcfs">[docs]</a><span class="k">def</span> <span class="nf">plot_gcfs</span><span class="p">():</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Get current font size, which is set by ut.plot_settings function&quot;&quot;&quot;</span>
-    <span class="c1"># Get the current plotting context</span>
-    <span class="n">current_context</span> <span class="o">=</span> <span class="n">sns</span><span class="o">.</span><span class="n">plotting_context</span><span class="p">()</span>
-    <span class="n">font_size</span> <span class="o">=</span> <span class="n">current_context</span><span class="p">[</span><span class="s1">&#39;font.size&#39;</span><span class="p">]</span>
-    <span class="k">return</span> <span class="n">font_size</span></div>
-
-
-<div class="viewcode-block" id="plot_set_legend"><a class="viewcode-back" href="../../../generated/aaanalysis.plot_set_legend.html#aaanalysis.plot_set_legend">[docs]</a><span class="k">def</span> <span class="nf">plot_set_legend</span><span class="p">(</span><span class="n">ax</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">handles</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">dict_color</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">list_cat</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">y</span><span class="o">=-</span><span class="mf">0.2</span><span class="p">,</span> <span class="n">x</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span> <span class="n">ncol</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span>
-                    <span class="n">fontsize</span><span class="o">=</span><span class="mi">11</span><span class="p">,</span> <span class="n">weight</span><span class="o">=</span><span class="s2">&quot;normal&quot;</span><span class="p">,</span> <span class="n">lw</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">edgecolor</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">return_handles</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">loc</span><span class="o">=</span><span class="s2">&quot;upper left&quot;</span><span class="p">,</span>
-                    <span class="n">labelspacing</span><span class="o">=</span><span class="mf">0.2</span><span class="p">,</span> <span class="n">columnspacing</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">title</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">fontsize_legend</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">title_align_left</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-                    <span class="n">fontsize_weight</span><span class="o">=</span><span class="s2">&quot;normal&quot;</span><span class="p">,</span> <span class="n">shape</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Set a customizable legend for a plot.</span>
-
-<span class="sd">    Parameters</span>
-<span class="sd">    ----------</span>
-<span class="sd">    ax : matplotlib.axes.Axes, default=None</span>
-<span class="sd">        The axes to attach the legend to.</span>
-<span class="sd">    handles : list, default=None</span>
-<span class="sd">        Handles for legend items.</span>
-<span class="sd">    dict_color : dict, default=None</span>
-<span class="sd">        A dictionary mapping categories to colors.</span>
-<span class="sd">    list_cat : list, default=None</span>
-<span class="sd">        List of categories to include in the legend.</span>
-<span class="sd">    labels : list, default=None</span>
-<span class="sd">        Labels for legend items.</span>
-<span class="sd">    y : float, default=-0.2</span>
-<span class="sd">        The y-coordinate for the legend&#39;s anchor point.</span>
-<span class="sd">    x : float, default=0.5</span>
-<span class="sd">        The x-coordinate for the legend&#39;s anchor point.</span>
-<span class="sd">    ncol : int, default=3</span>
-<span class="sd">        Number of columns in the legend.</span>
-<span class="sd">    fontsize : int, default=11</span>
-<span class="sd">        Font size for the legend text.</span>
-<span class="sd">    weight : str, default=&#39;normal&#39;</span>
-<span class="sd">        Weight of the font.</span>
-<span class="sd">    lw : float, default=0</span>
-<span class="sd">        Line width for legend items.</span>
-<span class="sd">    edgecolor : color, default=None</span>
-<span class="sd">        Edge color for legend items.</span>
-<span class="sd">    return_handles : bool, default=False</span>
-<span class="sd">        Whether to return handles and labels.</span>
-<span class="sd">    loc : str, default=&#39;upper left&#39;</span>
-<span class="sd">        Location for the legend.</span>
-<span class="sd">    labelspacing : float, default=0.2</span>
-<span class="sd">        Vertical spacing between legend items.</span>
-<span class="sd">    columnspacing : int, default=1</span>
-<span class="sd">        Horizontal spacing between legend columns.</span>
-<span class="sd">    title : str, default=None</span>
-<span class="sd">        Title for the legend.</span>
-<span class="sd">    fontsize_legend : int, default=None</span>
-<span class="sd">        Font size for the legend title.</span>
-<span class="sd">    title_align_left : bool, default=True</span>
-<span class="sd">        Whether to align the title to the left.</span>
-<span class="sd">    fontsize_weight : str, default=&#39;normal&#39;</span>
-<span class="sd">        Font weight for the legend title.</span>
-<span class="sd">    shape : str, default=None</span>
-<span class="sd">        Marker shape for legend items.</span>
-<span class="sd">    **kwargs : dict</span>
-<span class="sd">        Additional arguments passed directly to ax.legend() for finer control.</span>
-
-<span class="sd">    Returns</span>
-<span class="sd">    -------</span>
-<span class="sd">    ax : matplotlib.axes.Axes</span>
-<span class="sd">        The axes with the legend applied.</span>
-
-<span class="sd">    See Also</span>
-<span class="sd">    --------</span>
-<span class="sd">    matplotlib.pyplot.legend : For additional details on how the &#39;loc&#39; parameter can be customized.</span>
-<span class="sd">    matplotlib.lines.Line2D : For additional details on the different types of marker shapes (&#39;shape&#39; parameter).</span>
-
-<span class="sd">    Examples</span>
-<span class="sd">    --------</span>
-<span class="sd">    &gt;&gt;&gt; import aaanalysis as aa</span>
-<span class="sd">    &gt;&gt;&gt; aa.plot_set_legend(ax=ax, dict_color={&#39;Cat1&#39;: &#39;red&#39;, &#39;Cat2&#39;: &#39;blue&#39;}, shape=&#39;o&#39;)</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="c1"># Check input</span>
-    <span class="k">if</span> <span class="n">ax</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">ax</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">gca</span><span class="p">()</span>
-    <span class="n">list_cat</span> <span class="o">=</span> <span class="n">check_cats</span><span class="p">(</span><span class="n">list_cat</span><span class="o">=</span><span class="n">list_cat</span><span class="p">,</span> <span class="n">dict_color</span><span class="o">=</span><span class="n">dict_color</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="n">labels</span><span class="p">)</span>
-    <span class="n">args_float</span> <span class="o">=</span> <span class="p">{</span><span class="s2">&quot;y&quot;</span><span class="p">:</span> <span class="n">y</span><span class="p">,</span> <span class="s2">&quot;x&quot;</span><span class="p">:</span> <span class="n">x</span><span class="p">,</span> <span class="s2">&quot;lw&quot;</span><span class="p">:</span> <span class="n">lw</span><span class="p">,</span> <span class="s2">&quot;labelspacing&quot;</span><span class="p">:</span> <span class="n">labelspacing</span><span class="p">,</span>
-                  <span class="s2">&quot;columnspacing&quot;</span><span class="p">:</span> <span class="n">columnspacing</span><span class="p">}</span>
-    <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">args_float</span><span class="p">:</span>
-        <span class="n">ut</span><span class="o">.</span><span class="n">check_float</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="n">key</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">args_float</span><span class="p">[</span><span class="n">key</span><span class="p">])</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;ncol&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">ncol</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_non_negative_number</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;ncol&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">ncol</span><span class="p">,</span> <span class="n">min_val</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">just_int</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">accept_none</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_bool</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;return_handles&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">return_handles</span><span class="p">)</span>
-    <span class="n">ut</span><span class="o">.</span><span class="n">check_bool</span><span class="p">(</span><span class="n">name</span><span class="o">=</span><span class="s2">&quot;title_align_left&quot;</span><span class="p">,</span> <span class="n">val</span><span class="o">=</span><span class="n">title_align_left</span><span class="p">)</span>
-    <span class="c1"># TODO check other args</span>
-    <span class="c1"># Prepare the legend handles</span>
-    <span class="n">dict_leg</span> <span class="o">=</span> <span class="p">{</span><span class="n">cat</span><span class="p">:</span> <span class="n">dict_color</span><span class="p">[</span><span class="n">cat</span><span class="p">]</span> <span class="k">for</span> <span class="n">cat</span> <span class="ow">in</span> <span class="n">list_cat</span><span class="p">}</span>
-    <span class="c1"># Generate function for legend markers based on provided shape</span>
-    <span class="k">if</span> <span class="n">shape</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="k">if</span> <span class="n">edgecolor</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">f</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">l</span><span class="p">,</span> <span class="n">c</span><span class="p">:</span> <span class="n">mpl</span><span class="o">.</span><span class="n">patches</span><span class="o">.</span><span class="n">Patch</span><span class="p">(</span><span class="n">facecolor</span><span class="o">=</span><span class="n">l</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="n">c</span><span class="p">,</span> <span class="n">lw</span><span class="o">=</span><span class="n">lw</span><span class="p">,</span> <span class="n">edgecolor</span><span class="o">=</span><span class="n">l</span><span class="p">)</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="n">f</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">l</span><span class="p">,</span> <span class="n">c</span><span class="p">:</span> <span class="n">mpl</span><span class="o">.</span><span class="n">patches</span><span class="o">.</span><span class="n">Patch</span><span class="p">(</span><span class="n">facecolor</span><span class="o">=</span><span class="n">l</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="n">c</span><span class="p">,</span> <span class="n">lw</span><span class="o">=</span><span class="n">lw</span><span class="p">,</span> <span class="n">edgecolor</span><span class="o">=</span><span class="n">edgecolor</span><span class="p">)</span>
-    <span class="k">else</span><span class="p">:</span>
-        <span class="n">f</span> <span class="o">=</span> <span class="k">lambda</span> <span class="n">l</span><span class="p">,</span> <span class="n">c</span><span class="p">:</span> <span class="n">plt</span><span class="o">.</span><span class="n">Line2D</span><span class="p">([</span><span class="mi">0</span><span class="p">],</span> <span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">marker</span><span class="o">=</span><span class="n">shape</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="s1">&#39;w&#39;</span><span class="p">,</span> <span class="n">markerfacecolor</span><span class="o">=</span><span class="n">l</span><span class="p">,</span> <span class="n">markersize</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="n">c</span><span class="p">)</span>
-    <span class="c1"># Create handles if not provided</span>
-    <span class="n">handles</span> <span class="o">=</span> <span class="p">[</span><span class="n">f</span><span class="p">(</span><span class="n">l</span><span class="p">,</span> <span class="n">c</span><span class="p">)</span> <span class="k">for</span> <span class="n">c</span><span class="p">,</span> <span class="n">l</span> <span class="ow">in</span> <span class="n">dict_leg</span><span class="o">.</span><span class="n">items</span><span class="p">()]</span> <span class="k">if</span> <span class="n">handles</span> <span class="ow">is</span> <span class="kc">None</span> <span class="k">else</span> <span class="n">handles</span>
-    <span class="c1"># Return handles and labels if required</span>
-    <span class="k">if</span> <span class="n">return_handles</span><span class="p">:</span>
-        <span class="k">return</span> <span class="n">handles</span><span class="p">,</span> <span class="n">labels</span>
-    <span class="c1"># Prepare labels and args</span>
-    <span class="k">if</span> <span class="n">labels</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">labels</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">dict_leg</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span>
-    <span class="n">args</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">prop</span><span class="o">=</span><span class="p">{</span><span class="s2">&quot;weight&quot;</span><span class="p">:</span> <span class="n">weight</span><span class="p">,</span> <span class="s2">&quot;size&quot;</span><span class="p">:</span> <span class="n">fontsize</span><span class="p">},</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">fontsize_legend</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">args</span><span class="p">[</span><span class="s2">&quot;title_fontproperties&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">{</span><span class="s2">&quot;weight&quot;</span><span class="p">:</span> <span class="n">fontsize_weight</span><span class="p">,</span> <span class="s2">&quot;size&quot;</span><span class="p">:</span> <span class="n">fontsize_legend</span><span class="p">}</span>
-    <span class="c1"># Create the legend</span>
-    <span class="n">legend</span> <span class="o">=</span> <span class="n">ax</span><span class="o">.</span><span class="n">legend</span><span class="p">(</span><span class="n">handles</span><span class="o">=</span><span class="n">handles</span><span class="p">,</span> <span class="n">labels</span><span class="o">=</span><span class="n">labels</span><span class="p">,</span> <span class="n">bbox_to_anchor</span><span class="o">=</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">),</span> <span class="n">ncol</span><span class="o">=</span><span class="n">ncol</span><span class="p">,</span> <span class="n">loc</span><span class="o">=</span><span class="n">loc</span><span class="p">,</span>
-                       <span class="n">labelspacing</span><span class="o">=</span><span class="n">labelspacing</span><span class="p">,</span> <span class="n">columnspacing</span><span class="o">=</span><span class="n">columnspacing</span><span class="p">,</span> <span class="n">borderpad</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="o">**</span><span class="n">args</span><span class="p">,</span> <span class="n">title</span><span class="o">=</span><span class="n">title</span><span class="p">)</span>
-    <span class="c1"># Align the title if required</span>
-    <span class="k">if</span> <span class="n">title_align_left</span><span class="p">:</span>
-        <span class="n">legend</span><span class="o">.</span><span class="n">_legend_box</span><span class="o">.</span><span class="n">align</span> <span class="o">=</span> <span class="s2">&quot;left&quot;</span>
-    <span class="k">return</span> <span class="n">ax</span></div>
-</pre></div>
-
-           </div>
-          </div>
-          <footer>
-
-  <hr/>
-
-  <div role="contentinfo">
-    <p>&#169; Copyright 2023, Stephan Breimann.</p>
-  </div>
-
-   
-
-</footer>
-        </div>
-      </div>
-    </section>
-  </div>
-  <script>
-      jQuery(function () {
-          SphinxRtdTheme.Navigation.enable(true);
-      });
-  </script> 
-
-</body>
-</html>
\ No newline at end of file
diff --git a/docs/build/html/_modules/index.html b/docs/build/html/_modules/index.html
deleted file mode 100644
index 369b1ebf..00000000
--- a/docs/build/html/_modules/index.html
+++ /dev/null
@@ -1,128 +0,0 @@
-<!DOCTYPE html>
-<html class="writer-html5" lang="en" >
-<head>
-  <meta charset="utf-8" />
-  <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-  <title>Overview: module code &mdash; AAanalysis</title>
-      <link rel="stylesheet" href="../_static/pygments.css" type="text/css" />
-      <link rel="stylesheet" href="../_static/css/theme.css" type="text/css" />
-      <link rel="stylesheet" href="../_static/copybutton.css" type="text/css" />
-      <link rel="stylesheet" href="../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" type="text/css" />
-      <link rel="stylesheet" href="../_static/plot_directive.css" type="text/css" />
-      <link rel="stylesheet" href="../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css" type="text/css" />
-      <link rel="stylesheet" href="../_static/css/style.css" type="text/css" />
-    <link rel="shortcut icon" href="../_static/logo_small.png"/>
-  <!--[if lt IE 9]>
-    <script src="../_static/js/html5shiv.min.js"></script>
-  <![endif]-->
-  
-        <script data-url_root="../" id="documentation_options" src="../_static/documentation_options.js"></script>
-        <script src="../_static/jquery.js"></script>
-        <script src="../_static/underscore.js"></script>
-        <script src="../_static/_sphinx_javascript_frameworks_compat.js"></script>
-        <script src="../_static/doctools.js"></script>
-        <script src="../_static/sphinx_highlight.js"></script>
-        <script src="../_static/clipboard.min.js"></script>
-        <script src="../_static/copybutton.js"></script>
-        <script src="../_static/design-tabs.js"></script>
-    <script src="../_static/js/theme.js"></script>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" /> 
-</head>
-
-<body class="wy-body-for-nav"> 
-  <div class="wy-grid-for-nav">
-    <nav data-toggle="wy-nav-shift" class="wy-nav-side">
-      <div class="wy-side-scroll">
-        <div class="wy-side-nav-search"  style="background: #343131" >
-            <a href="../index.html">
-            <img src="../_static/logo_big_trans.png" class="logo" alt="Logo"/>
-          </a>
-              <div class="version">
-                latest
-              </div>
-<div role="search">
-  <form id="rtd-search-form" class="wy-form" action="../search.html" method="get">
-    <input type="text" name="q" placeholder="Search docs" />
-    <input type="hidden" name="check_keywords" value="yes" />
-    <input type="hidden" name="area" value="default" />
-  </form>
-</div>
-        </div><div class="wy-menu wy-menu-vertical" data-spy="affix" role="navigation" aria-label="Navigation menu">
-              <p class="caption" role="heading"><span class="caption-text">OVERVIEW</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../index/introduction.html">Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../index/usage_principles.html">Usage Principles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../index/CONTRIBUTING_COPY.html">Contributing</a></li>
-</ul>
-<p class="caption" role="heading"><span class="caption-text">EXAMPLES</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../tutorials.html">Tutorials</a></li>
-</ul>
-<p class="caption" role="heading"><span class="caption-text">REFERENCES</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../api.html">API</a></li>
-</ul>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="../_index/tables.html">Tables</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../index/references.html">References</a></li>
-</ul>
-
-        </div>
-      </div>
-    </nav>
-
-    <section data-toggle="wy-nav-shift" class="wy-nav-content-wrap"><nav class="wy-nav-top" aria-label="Mobile navigation menu"  style="background: #343131" >
-          <i data-toggle="wy-nav-top" class="fa fa-bars"></i>
-          <a href="../index.html">AAanalysis</a>
-      </nav>
-
-      <div class="wy-nav-content">
-        <div class="rst-content">
-          <div role="navigation" aria-label="Page navigation">
-  <ul class="wy-breadcrumbs">
-      <li><a href="../index.html" class="icon icon-home"></a></li>
-      <li class="breadcrumb-item active">Overview: module code</li>
-      <li class="wy-breadcrumbs-aside">
-      </li>
-  </ul>
-  <hr/>
-</div>
-          <div role="main" class="document" itemscope="itemscope" itemtype="http://schema.org/Article">
-           <div itemprop="articleBody">
-             
-  <h1>All modules for which code is available</h1>
-<ul><li><a href="aaanalysis/aaclust/aaclust.html">aaanalysis.aaclust.aaclust</a></li>
-<li><a href="aaanalysis/cpp/cpp.html">aaanalysis.cpp.cpp</a></li>
-<li><a href="aaanalysis/cpp/cpp_plot.html">aaanalysis.cpp.cpp_plot</a></li>
-<li><a href="aaanalysis/cpp/feature.html">aaanalysis.cpp.feature</a></li>
-<li><a href="aaanalysis/data_loader/data_loader.html">aaanalysis.data_loader.data_loader</a></li>
-<li><a href="aaanalysis/dpulearn/dpulearn.html">aaanalysis.dpulearn.dpulearn</a></li>
-<li><a href="aaanalysis/plotting/plotting_functions.html">aaanalysis.plotting.plotting_functions</a></li>
-</ul>
-
-           </div>
-          </div>
-          <footer>
-
-  <hr/>
-
-  <div role="contentinfo">
-    <p>&#169; Copyright 2023, Stephan Breimann.</p>
-  </div>
-
-   
-
-</footer>
-        </div>
-      </div>
-    </section>
-  </div>
-  <script>
-      jQuery(function () {
-          SphinxRtdTheme.Navigation.enable(true);
-      });
-  </script> 
-
-</body>
-</html>
\ No newline at end of file
diff --git a/docs/build/html/_static/css/style.css b/docs/build/html/_static/css/style.css
index b8bfd848..b6f89b7b 100644
--- a/docs/build/html/_static/css/style.css
+++ b/docs/build/html/_static/css/style.css
@@ -32,6 +32,13 @@
    background: #f7f7f7;  /* Sets the background color */
 }
 
+/* Style for inline code */
+.rst-content code {
+    background-color: #f5f5f5;  /* Gray background */
+    font-family: monospace;     /* Monospace font */
+    padding: 2px 2px;           /* Padding around the text */
+}
+
 /* Style for the search input box in the sidebar */
 .wy-side-nav-search input[type=text] {
    border-color: #666666;  /* Sets the border color */
@@ -67,4 +74,4 @@ html.writer-html4 .rst-content dl:not(.docutils)>dt, html.writer-html5 .rst-cont
 /* Style for vertical menu items */
 .wy-menu-vertical a {
    color: #d9d9d9;  /* Sets the text color */
-}
+}
\ No newline at end of file
diff --git a/docs/build/html/api.html b/docs/build/html/api.html
index fac04f60..e5cfd2c3 100644
--- a/docs/build/html/api.html
+++ b/docs/build/html/api.html
@@ -125,7 +125,7 @@
       <li><a href="index.html" class="icon icon-home"></a></li>
       <li class="breadcrumb-item active">API</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="_sources/api.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/api.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
diff --git a/docs/build/html/generated/aaanalysis.AAclust.html b/docs/build/html/generated/aaanalysis.AAclust.html
index a2a5bc31..51dce869 100644
--- a/docs/build/html/generated/aaanalysis.AAclust.html
+++ b/docs/build/html/generated/aaanalysis.AAclust.html
@@ -110,7 +110,7 @@
           <li class="breadcrumb-item"><a href="../api.html">API</a></li>
       <li class="breadcrumb-item active">aaanalysis.AAclust</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/generated/aaanalysis.AAclust.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/generated/aaanalysis.AAclust.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
@@ -122,7 +122,7 @@
 <h1>aaanalysis.AAclust<a class="headerlink" href="#aaanalysis-aaclust" title="Permalink to this heading"></a></h1>
 <dl class="py class">
 <dt class="sig sig-object py" id="aaanalysis.AAclust">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">AAclust</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">model</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">model_kwargs</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/aaclust/aaclust.html#AAclust"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/aaclust/aaclust.py#L306-L615"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.AAclust" title="Permalink to this definition"></a></dt>
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">AAclust</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">model</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">model_kwargs</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/aaclust/aaclust.py#L306-L615"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.AAclust" title="Permalink to this definition"></a></dt>
 <dd><p>Bases: <a class="reference external" href="https://docs.python.org/3/library/functions.html#object" title="(in Python v3.11)"><code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></a></p>
 <p>AAclust: A k-optimized clustering framework for selecting redundancy-reduced set of numerical scales.</p>
 <p>AAclust is designed primarily for amino acid scales but is versatile enough for any set of numerical indices.
@@ -218,7 +218,7 @@ <h1>aaanalysis.AAclust<a class="headerlink" href="#aaanalysis-aaclust" title="Pe
 
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.AAclust.__init__">
-<span class="sig-name descname"><span class="pre">__init__</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">model</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">model_kwargs</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/aaclust/aaclust.html#AAclust.__init__"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/aaclust/aaclust.py#L343-L361"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.AAclust.__init__" title="Permalink to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">__init__</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">model</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">model_kwargs</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/aaclust/aaclust.py#L343-L361"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.AAclust.__init__" title="Permalink to this definition"></a></dt>
 <dd></dd></dl>
 
 <p class="rubric">Methods</p>
@@ -253,7 +253,7 @@ <h1>aaanalysis.AAclust<a class="headerlink" href="#aaanalysis-aaclust" title="Pe
 </table>
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.AAclust.fit">
-<span class="sig-name descname"><span class="pre">fit</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">X</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">names</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">on_center</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">min_th</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">merge_metric</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'euclidean'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_clusters</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/aaclust/aaclust.html#AAclust.fit"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/aaclust/aaclust.py#L364-L454"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.AAclust.fit" title="Permalink to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">fit</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">X</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">names</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">on_center</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">min_th</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">merge_metric</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'euclidean'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_clusters</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/aaclust/aaclust.py#L364-L454"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.AAclust.fit" title="Permalink to this definition"></a></dt>
 <dd><p>Fit the AAclust model on the data, optimizing cluster formation using Pearson correlation.</p>
 <p>AAclust determines the optimal number of clusters, k, without pre-specification. It partitions data(X) into
 clusters by maximizing the within-cluster Pearson correlation beyond the ‘min_th’ threshold. The quality of
@@ -294,7 +294,7 @@ <h1>aaanalysis.AAclust<a class="headerlink" href="#aaanalysis-aaclust" title="Pe
 
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.AAclust.cluster_naming">
-<span class="sig-name descname"><span class="pre">cluster_naming</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">names</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labels</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">name_unclassified</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'Unclassified'</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/aaclust/aaclust.html#AAclust.cluster_naming"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/aaclust/aaclust.py#L456-L500"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.AAclust.cluster_naming" title="Permalink to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">cluster_naming</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">names</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labels</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">name_unclassified</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'Unclassified'</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/aaclust/aaclust.py#L456-L500"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.AAclust.cluster_naming" title="Permalink to this definition"></a></dt>
 <dd><p>Assigns names to clusters based on scale names and their frequency.</p>
 <p>This method renames clusters based on the names of the scales in each cluster, with priority given to the
 most frequent scales. If the name is already used or does not exist, it defaults to ‘name_unclassified’.</p>
@@ -317,7 +317,7 @@ <h1>aaanalysis.AAclust<a class="headerlink" href="#aaanalysis-aaclust" title="Pe
 
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.AAclust.get_cluster_centers">
-<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">get_cluster_centers</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">X</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labels</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/aaclust/aaclust.html#AAclust.get_cluster_centers"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/aaclust/aaclust.py#L502-L522"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.AAclust.get_cluster_centers" title="Permalink to this definition"></a></dt>
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">get_cluster_centers</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">X</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labels</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/aaclust/aaclust.py#L502-L522"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.AAclust.get_cluster_centers" title="Permalink to this definition"></a></dt>
 <dd><p>Computes the center of each cluster based on the given labels.</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters</dt>
@@ -338,7 +338,7 @@ <h1>aaanalysis.AAclust<a class="headerlink" href="#aaanalysis-aaclust" title="Pe
 
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.AAclust.get_cluster_medoids">
-<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">get_cluster_medoids</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">X</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labels</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/aaclust/aaclust.html#AAclust.get_cluster_medoids"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/aaclust/aaclust.py#L524-L546"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.AAclust.get_cluster_medoids" title="Permalink to this definition"></a></dt>
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">get_cluster_medoids</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">X</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labels</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/aaclust/aaclust.py#L524-L546"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.AAclust.get_cluster_medoids" title="Permalink to this definition"></a></dt>
 <dd><p>Computes the medoid of each cluster based on the given labels.</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters</dt>
@@ -363,7 +363,7 @@ <h1>aaanalysis.AAclust<a class="headerlink" href="#aaanalysis-aaclust" title="Pe
 
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.AAclust.correlation">
-<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">correlation</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">X_test</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">X_ref</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labels_test</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labels_ref</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">3</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">positive</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">on_center</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">except_unclassified</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/aaclust/aaclust.html#AAclust.correlation"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/aaclust/aaclust.py#L548-L611"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.AAclust.correlation" title="Permalink to this definition"></a></dt>
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">correlation</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">X_test</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">X_ref</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labels_test</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labels_ref</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">3</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">positive</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">on_center</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">except_unclassified</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/aaclust/aaclust.py#L548-L611"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.AAclust.correlation" title="Permalink to this definition"></a></dt>
 <dd><p>Computes the correlation of test data with reference cluster centers.</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters</dt>
@@ -389,7 +389,7 @@ <h1>aaanalysis.AAclust<a class="headerlink" href="#aaanalysis-aaclust" title="Pe
 
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.AAclust.eval">
-<span class="sig-name descname"><span class="pre">eval</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/aaclust/aaclust.html#AAclust.eval"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/aaclust/aaclust.py#L613-L615"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.AAclust.eval" title="Permalink to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">eval</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/aaclust/aaclust.py#L613-L615"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.AAclust.eval" title="Permalink to this definition"></a></dt>
 <dd></dd></dl>
 
 </dd></dl>
diff --git a/docs/build/html/generated/aaanalysis.CPP.html b/docs/build/html/generated/aaanalysis.CPP.html
index 95d79ce7..563d682a 100644
--- a/docs/build/html/generated/aaanalysis.CPP.html
+++ b/docs/build/html/generated/aaanalysis.CPP.html
@@ -110,7 +110,7 @@
           <li class="breadcrumb-item"><a href="../api.html">API</a></li>
       <li class="breadcrumb-item active">aaanalysis.CPP</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/generated/aaanalysis.CPP.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/generated/aaanalysis.CPP.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
@@ -122,7 +122,7 @@
 <h1>aaanalysis.CPP<a class="headerlink" href="#aaanalysis-cpp" title="Permalink to this heading"></a></h1>
 <dl class="py class">
 <dt class="sig sig-object py" id="aaanalysis.CPP">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">CPP</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_scales</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_parts</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">split_kws</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">accept_gaps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/cpp/cpp.html#CPP"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp.py#L32-L321"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPP" title="Permalink to this definition"></a></dt>
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">CPP</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_scales</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_parts</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">split_kws</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">accept_gaps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp.py#L32-L321"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPP" title="Permalink to this definition"></a></dt>
 <dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">Tool</span></code></p>
 <p>Create and filter features that are most discriminant between two sets of sequences.</p>
 <dl class="field-list simple">
@@ -143,7 +143,7 @@ <h1>aaanalysis.CPP<a class="headerlink" href="#aaanalysis-cpp" title="Permalink
 </div>
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.CPP.__init__">
-<span class="sig-name descname"><span class="pre">__init__</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_scales</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_parts</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">split_kws</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">accept_gaps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/cpp/cpp.html#CPP.__init__"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp.py#L57-L78"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPP.__init__" title="Permalink to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">__init__</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_scales</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_parts</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">split_kws</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">accept_gaps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp.py#L57-L78"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPP.__init__" title="Permalink to this definition"></a></dt>
 <dd></dd></dl>
 
 <p class="rubric">Methods</p>
@@ -166,7 +166,7 @@ <h1>aaanalysis.CPP<a class="headerlink" href="#aaanalysis-cpp" title="Permalink
 </table>
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.CPP.run">
-<span class="sig-name descname"><span class="pre">run</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">labels</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">parametric</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_filter</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">100</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">20</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ext_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">4</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">start</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">check_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_pre_filter</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pct_pre_filter</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_std_test</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.2</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_overlap</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_cor</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_processes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/cpp/cpp.html#CPP.run"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp.py#L205-L316"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPP.run" title="Permalink to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">run</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">labels</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">parametric</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_filter</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">100</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">20</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ext_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">4</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">start</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">check_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_pre_filter</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pct_pre_filter</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_std_test</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.2</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_overlap</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_cor</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_processes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp.py#L205-L316"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPP.run" title="Permalink to this definition"></a></dt>
 <dd><p>Perform CPP pipeline by creation and two-step filtering of features. CPP aims to
 identify a collection of non-redundant features that are most discriminant between
 a test and a reference group of sequences.</p>
@@ -221,7 +221,7 @@ <h1>aaanalysis.CPP<a class="headerlink" href="#aaanalysis-cpp" title="Permalink
 
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.CPP.eval">
-<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">eval</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_feat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">features</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/cpp/cpp.html#CPP.eval"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp.py#L318-L321"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPP.eval" title="Permalink to this definition"></a></dt>
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">eval</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_feat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">features</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp.py#L318-L321"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPP.eval" title="Permalink to this definition"></a></dt>
 <dd><p>Get evaluation for provided dataset</p>
 </dd></dl>
 
diff --git a/docs/build/html/generated/aaanalysis.CPPPlot.html b/docs/build/html/generated/aaanalysis.CPPPlot.html
index db6286ab..9c4c9cf0 100644
--- a/docs/build/html/generated/aaanalysis.CPPPlot.html
+++ b/docs/build/html/generated/aaanalysis.CPPPlot.html
@@ -110,7 +110,7 @@
           <li class="breadcrumb-item"><a href="../api.html">API</a></li>
       <li class="breadcrumb-item active">aaanalysis.CPPPlot</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/generated/aaanalysis.CPPPlot.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/generated/aaanalysis.CPPPlot.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
@@ -122,7 +122,7 @@
 <h1>aaanalysis.CPPPlot<a class="headerlink" href="#aaanalysis-cppplot" title="Permalink to this heading"></a></h1>
 <dl class="py class">
 <dt class="sig sig-object py" id="aaanalysis.CPPPlot">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">CPPPlot</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">accept_gaps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ext_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">4</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/cpp/cpp_plot.html#CPPPlot"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp_plot.py#L209-L655"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPPPlot" title="Permalink to this definition"></a></dt>
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">CPPPlot</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">accept_gaps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ext_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">4</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp_plot.py#L209-L655"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPPPlot" title="Permalink to this definition"></a></dt>
 <dd><p>Bases: <a class="reference external" href="https://docs.python.org/3/library/functions.html#object" title="(in Python v3.11)"><code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></a></p>
 <p>Create and filter features that are most discriminant between two sets of sequences.</p>
 <dl class="field-list simple">
@@ -139,7 +139,7 @@ <h1>aaanalysis.CPPPlot<a class="headerlink" href="#aaanalysis-cppplot" title="Pe
 </dl>
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.CPPPlot.__init__">
-<span class="sig-name descname"><span class="pre">__init__</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">accept_gaps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ext_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">4</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/cpp/cpp_plot.html#CPPPlot.__init__"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp_plot.py#L228-L242"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPPPlot.__init__" title="Permalink to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">__init__</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">accept_gaps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ext_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">4</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp_plot.py#L228-L242"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPPPlot.__init__" title="Permalink to this definition"></a></dt>
 <dd></dd></dl>
 
 <p class="rubric">Methods</p>
@@ -165,7 +165,7 @@ <h1>aaanalysis.CPPPlot<a class="headerlink" href="#aaanalysis-cppplot" title="Pe
 </table>
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.CPPPlot.profile">
-<span class="sig-name descname"><span class="pre">profile</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_feat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">y</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'category'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">val_col</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'mean_dif'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">val_type</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'count'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">normalize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">figsize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">(7,</span> <span class="pre">5)</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">title</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">title_kws</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dict_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">edge_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'none'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">bar_width</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.75</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">add_jmd_tmd</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">20</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">start</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_seq</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_seq</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_seq</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'mediumspringgreen'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'blue'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_seq_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'black'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_seq_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'white'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">seq_size</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_jmd_fontsize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">xtick_size</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">11.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">xtick_width</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">2.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">xtick_length</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">5.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">xticks_pos</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ytick_size</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ytick_width</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">2.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ytick_length</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">5.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ylim</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">highlight_tmd_area</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">highlight_alpha</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.15</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid_axis</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'both'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">add_legend_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">legend_kws</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">shap_plot</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/cpp/cpp_plot.html#CPPPlot.profile"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp_plot.py#L245-L429"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPPPlot.profile" title="Permalink to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">profile</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_feat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">y</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'category'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">val_col</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'mean_dif'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">val_type</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'count'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">normalize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">figsize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">(7,</span> <span class="pre">5)</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">title</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">title_kws</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dict_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">edge_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'none'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">bar_width</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.75</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">add_jmd_tmd</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">20</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">start</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_seq</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_seq</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_seq</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'mediumspringgreen'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'blue'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_seq_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'black'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_seq_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'white'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">seq_size</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_jmd_fontsize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">xtick_size</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">11.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">xtick_width</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">2.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">xtick_length</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">5.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">xticks_pos</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ytick_size</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ytick_width</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">2.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ytick_length</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">5.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ylim</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">highlight_tmd_area</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">highlight_alpha</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.15</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid_axis</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'both'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">add_legend_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">legend_kws</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">shap_plot</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp_plot.py#L245-L429"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPPPlot.profile" title="Permalink to this definition"></a></dt>
 <dd><p>Plot feature profile for given features from ‘df_feat’.</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters</dt>
@@ -222,7 +222,7 @@ <h1>aaanalysis.CPPPlot<a class="headerlink" href="#aaanalysis-cppplot" title="Pe
 
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.CPPPlot.heatmap">
-<span class="sig-name descname"><span class="pre">heatmap</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_feat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">y</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'subcategory'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">val_col</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'mean_dif'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">val_type</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'mean'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">normalize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">figsize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">(8,</span> <span class="pre">5)</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">title</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">title_kws</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">vmin</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">vmax</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid_on</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">cmap</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'RdBu_r'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">cmap_n_colors</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dict_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">cbar_kws</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">facecolor_dark</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">add_jmd_tmd</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">20</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">start</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_seq</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_seq</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_seq</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'mediumspringgreen'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'blue'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_seq_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'black'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_seq_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'white'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">seq_size</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_jmd_fontsize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">xticks_pos</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">xtick_size</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">11.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">xtick_width</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">2.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">xtick_length</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">5.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ytick_size</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">add_legend_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">legend_kws</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">add_importance_map</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">cbar_pct</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/cpp/cpp_plot.html#CPPPlot.heatmap"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp_plot.py#L431-L641"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPPPlot.heatmap" title="Permalink to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">heatmap</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_feat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">y</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'subcategory'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">val_col</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'mean_dif'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">val_type</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'mean'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">normalize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">figsize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">(8,</span> <span class="pre">5)</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">title</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">title_kws</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">vmin</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">vmax</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid_on</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">cmap</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'RdBu_r'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">cmap_n_colors</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dict_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">cbar_kws</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">facecolor_dark</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">add_jmd_tmd</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">20</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">start</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_seq</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_seq</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_seq</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'mediumspringgreen'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'blue'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_seq_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'black'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_seq_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'white'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">seq_size</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_jmd_fontsize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">xticks_pos</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">xtick_size</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">11.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">xtick_width</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">2.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">xtick_length</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">5.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ytick_size</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">add_legend_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">legend_kws</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">add_importance_map</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">cbar_pct</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp_plot.py#L431-L641"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPPPlot.heatmap" title="Permalink to this definition"></a></dt>
 <dd><p>Plot a featuremap of the selected value column with scale information (y-axis) versus sequence position (x-axis).</p>
 <p>This is a wrapper function for <a class="reference external" href="https://seaborn.pydata.org/generated/seaborn.heatmap.html#seaborn.heatmap" title="(in seaborn v0.12.2)"><code class="xref py py-func docutils literal notranslate"><span class="pre">seaborn.heatmap()</span></code></a>, designed to highlight differences between two sets
 of sequences at the positional level (e.g., amino acid level for protein sequences).</p>
@@ -307,7 +307,7 @@ <h1>aaanalysis.CPPPlot<a class="headerlink" href="#aaanalysis-cppplot" title="Pe
 
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.CPPPlot.update_seq_size">
-<span class="sig-name descname"><span class="pre">update_seq_size</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/cpp/cpp_plot.html#CPPPlot.update_seq_size"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp_plot.py#L643-L655"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPPPlot.update_seq_size" title="Permalink to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">update_seq_size</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/cpp_plot.py#L643-L655"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.CPPPlot.update_seq_size" title="Permalink to this definition"></a></dt>
 <dd></dd></dl>
 
 </dd></dl>
diff --git a/docs/build/html/generated/aaanalysis.SequenceFeature.html b/docs/build/html/generated/aaanalysis.SequenceFeature.html
index aa9d3d69..b6c9cccb 100644
--- a/docs/build/html/generated/aaanalysis.SequenceFeature.html
+++ b/docs/build/html/generated/aaanalysis.SequenceFeature.html
@@ -110,7 +110,7 @@
           <li class="breadcrumb-item"><a href="../api.html">API</a></li>
       <li class="breadcrumb-item active">aaanalysis.SequenceFeature</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/generated/aaanalysis.SequenceFeature.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/generated/aaanalysis.SequenceFeature.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
@@ -122,7 +122,7 @@
 <h1>aaanalysis.SequenceFeature<a class="headerlink" href="#aaanalysis-sequencefeature" title="Permalink to this heading"></a></h1>
 <dl class="py class">
 <dt class="sig sig-object py" id="aaanalysis.SequenceFeature">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">SequenceFeature</span></span><a class="reference internal" href="../_modules/aaanalysis/cpp/feature.html#SequenceFeature"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L169-L623"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature" title="Permalink to this definition"></a></dt>
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">SequenceFeature</span></span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L169-L623"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature" title="Permalink to this definition"></a></dt>
 <dd><p>Bases: <a class="reference external" href="https://docs.python.org/3/library/functions.html#object" title="(in Python v3.11)"><code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></a></p>
 <p>Retrieve and create sequence feature components (Part, Split, and Scale).</p>
 <div class="admonition-notes admonition">
@@ -189,7 +189,7 @@ <h1>aaanalysis.SequenceFeature<a class="headerlink" href="#aaanalysis-sequencefe
 </table>
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.SequenceFeature.get_df_parts">
-<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">get_df_parts</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_seq</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">list_parts</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ext_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">4</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">all_parts</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/cpp/feature.html#SequenceFeature.get_df_parts"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L198-L262"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature.get_df_parts" title="Permalink to this definition"></a></dt>
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">get_df_parts</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_seq</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">list_parts</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ext_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">4</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">all_parts</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L198-L262"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature.get_df_parts" title="Permalink to this definition"></a></dt>
 <dd><p>Create DataFrane with sequence parts.</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters</dt>
@@ -235,7 +235,7 @@ <h1>aaanalysis.SequenceFeature<a class="headerlink" href="#aaanalysis-sequencefe
 
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.SequenceFeature.get_split_kws">
-<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">get_split_kws</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">n_split_min</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_split_max</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">15</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">steps_pattern</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_min</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">2</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_max</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">4</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">len_max</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">15</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">steps_periodicpattern</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">split_types</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/cpp/feature.html#SequenceFeature.get_split_kws"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L264-L326"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature.get_split_kws" title="Permalink to this definition"></a></dt>
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">get_split_kws</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">n_split_min</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_split_max</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">15</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">steps_pattern</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_min</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">2</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_max</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">4</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">len_max</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">15</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">steps_periodicpattern</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">split_types</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L264-L326"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature.get_split_kws" title="Permalink to this definition"></a></dt>
 <dd><p>Create dictionary with kwargs for three split types: Segment, Pattern, PeriodicPattern</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters</dt>
@@ -282,7 +282,7 @@ <h1>aaanalysis.SequenceFeature<a class="headerlink" href="#aaanalysis-sequencefe
 
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.SequenceFeature.get_features">
-<span class="sig-name descname"><span class="pre">get_features</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">list_parts</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">split_kws</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_scales</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">all_parts</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/cpp/feature.html#SequenceFeature.get_features"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L328-L365"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature.get_features" title="Permalink to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">get_features</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">list_parts</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">split_kws</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_scales</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">all_parts</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L328-L365"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature.get_features" title="Permalink to this definition"></a></dt>
 <dd><p>Create list of all feature ids for given Parts, Splits, and Scales</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters</dt>
@@ -304,7 +304,7 @@ <h1>aaanalysis.SequenceFeature<a class="headerlink" href="#aaanalysis-sequencefe
 
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.SequenceFeature.feat_matrix">
-<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">feat_matrix</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">features</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_parts</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_scales</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">accept_gaps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_jobs</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">return_labels</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/cpp/feature.html#SequenceFeature.feat_matrix"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L367-L427"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature.feat_matrix" title="Permalink to this definition"></a></dt>
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">feat_matrix</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">features</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_parts</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_scales</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">accept_gaps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_jobs</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">return_labels</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L367-L427"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature.feat_matrix" title="Permalink to this definition"></a></dt>
 <dd><p>Create feature matrix for given feature ids and sequence parts.</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters</dt>
@@ -329,7 +329,7 @@ <h1>aaanalysis.SequenceFeature<a class="headerlink" href="#aaanalysis-sequencefe
 
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.SequenceFeature.feat_names">
-<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">feat_names</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">features</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">20</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ext_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">start</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/cpp/feature.html#SequenceFeature.feat_names"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L430-L485"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature.feat_names" title="Permalink to this definition"></a></dt>
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">feat_names</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">features</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">20</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ext_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">start</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L430-L485"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature.feat_names" title="Permalink to this definition"></a></dt>
 <dd><p>Convert feature ids (PART-SPLIT-SCALE) into feature names (scale name [positions]).</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters</dt>
@@ -366,7 +366,7 @@ <h1>aaanalysis.SequenceFeature<a class="headerlink" href="#aaanalysis-sequencefe
 
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.SequenceFeature.add_feat_value">
-<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">add_feat_value</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_parts</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">split</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dict_scale</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">accept_gaps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/cpp/feature.html#SequenceFeature.add_feat_value"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L490-L537"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature.add_feat_value" title="Permalink to this definition"></a></dt>
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">add_feat_value</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_parts</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">split</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dict_scale</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">accept_gaps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L490-L537"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature.add_feat_value" title="Permalink to this definition"></a></dt>
 <dd><p>Create feature values for all sequence parts by combining Part, Split, and Scale.</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters</dt>
@@ -415,7 +415,7 @@ <h1>aaanalysis.SequenceFeature<a class="headerlink" href="#aaanalysis-sequencefe
 
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.SequenceFeature.add_dif">
-<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">add_dif</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_feat=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_seq=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labels=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sample_name=&lt;class</span> <span class="pre">'str'&gt;</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ref_group=0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">accept_gaps=False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_len=10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_len=10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_parts=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_scales=None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/cpp/feature.html#SequenceFeature.add_dif"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L539-L580"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature.add_dif" title="Permalink to this definition"></a></dt>
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">add_dif</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_feat=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_seq=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labels=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sample_name=&lt;class</span> <span class="pre">'str'&gt;</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ref_group=0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">accept_gaps=False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_len=10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_len=10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_parts=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_scales=None</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L539-L580"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature.add_dif" title="Permalink to this definition"></a></dt>
 <dd><p>Add feature value difference between sample and reference group to DataFrame.</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters</dt>
@@ -439,7 +439,7 @@ <h1>aaanalysis.SequenceFeature<a class="headerlink" href="#aaanalysis-sequencefe
 
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.SequenceFeature.add_position">
-<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">add_position</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_feat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">features</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">start</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">20</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ext_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">4</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">part_split</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/cpp/feature.html#SequenceFeature.add_position"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L582-L623"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature.add_position" title="Permalink to this definition"></a></dt>
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">add_position</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">df_feat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">features</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">start</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tmd_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">20</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_n_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">jmd_c_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ext_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">4</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">part_split</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/cpp/feature.py#L582-L623"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.SequenceFeature.add_position" title="Permalink to this definition"></a></dt>
 <dd><p>Create list with positions for given feature names</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters</dt>
diff --git a/docs/build/html/generated/aaanalysis.dPULearn.html b/docs/build/html/generated/aaanalysis.dPULearn.html
index 1ea6e7d1..484b619d 100644
--- a/docs/build/html/generated/aaanalysis.dPULearn.html
+++ b/docs/build/html/generated/aaanalysis.dPULearn.html
@@ -107,7 +107,7 @@
           <li class="breadcrumb-item"><a href="../api.html">API</a></li>
       <li class="breadcrumb-item active">aaanalysis.dPULearn</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/generated/aaanalysis.dPULearn.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/generated/aaanalysis.dPULearn.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
@@ -119,7 +119,7 @@
 <h1>aaanalysis.dPULearn<a class="headerlink" href="#aaanalysis-dpulearn" title="Permalink to this heading"></a></h1>
 <dl class="py class">
 <dt class="sig sig-object py" id="aaanalysis.dPULearn">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">dPULearn</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_components</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.8</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pca_kwargs</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">metric</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/dpulearn/dpulearn.html#dPULearn"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/dpulearn/dpulearn.py#L185-L307"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.dPULearn" title="Permalink to this definition"></a></dt>
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">dPULearn</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_components</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.8</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pca_kwargs</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">metric</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/dpulearn/dpulearn.py#L185-L307"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.dPULearn" title="Permalink to this definition"></a></dt>
 <dd><p>Bases: <a class="reference external" href="https://docs.python.org/3/library/functions.html#object" title="(in Python v3.11)"><code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></a></p>
 <p>Deterministic Positive-Unlabeled (dPULearn) model.</p>
 <p>dPULearn offers a deterministic approach for Positive-Unlabeled (PU) learning. The model primarily employs
@@ -168,7 +168,7 @@ <h1>aaanalysis.dPULearn<a class="headerlink" href="#aaanalysis-dpulearn" title="
 </div>
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.dPULearn.__init__">
-<span class="sig-name descname"><span class="pre">__init__</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_components</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.8</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pca_kwargs</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">metric</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/dpulearn/dpulearn.html#dPULearn.__init__"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/dpulearn/dpulearn.py#L222-L233"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.dPULearn.__init__" title="Permalink to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">__init__</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_components</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.8</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pca_kwargs</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">metric</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/dpulearn/dpulearn.py#L222-L233"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.dPULearn.__init__" title="Permalink to this definition"></a></dt>
 <dd></dd></dl>
 
 <p class="rubric">Methods</p>
@@ -191,7 +191,7 @@ <h1>aaanalysis.dPULearn<a class="headerlink" href="#aaanalysis-dpulearn" title="
 </table>
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.dPULearn.fit">
-<span class="sig-name descname"><span class="pre">fit</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">X</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labels</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_neg</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">label_pos</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">name_neg</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'REL_NEG'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_seq</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">col_class</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'class'</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/dpulearn/dpulearn.html#dPULearn.fit"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/dpulearn/dpulearn.py#L236-L304"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.dPULearn.fit" title="Permalink to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">fit</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">X</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labels</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_neg</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">label_pos</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">name_neg</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'REL_NEG'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">df_seq</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">col_class</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'class'</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/dpulearn/dpulearn.py#L236-L304"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.dPULearn.fit" title="Permalink to this definition"></a></dt>
 <dd><p>Fit the dPULearn model to identify reliable negative samples
 from the provided feature matrix and labels.</p>
 <dl class="field-list simple">
@@ -242,7 +242,7 @@ <h1>aaanalysis.dPULearn<a class="headerlink" href="#aaanalysis-dpulearn" title="
 
 <dl class="py method">
 <dt class="sig sig-object py" id="aaanalysis.dPULearn.eval">
-<span class="sig-name descname"><span class="pre">eval</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/dpulearn/dpulearn.html#dPULearn.eval"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/dpulearn/dpulearn.py#L306-L307"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.dPULearn.eval" title="Permalink to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">eval</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/dpulearn/dpulearn.py#L306-L307"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.dPULearn.eval" title="Permalink to this definition"></a></dt>
 <dd></dd></dl>
 
 </dd></dl>
diff --git a/docs/build/html/generated/aaanalysis.load_dataset.html b/docs/build/html/generated/aaanalysis.load_dataset.html
index f0facf71..13c761c8 100644
--- a/docs/build/html/generated/aaanalysis.load_dataset.html
+++ b/docs/build/html/generated/aaanalysis.load_dataset.html
@@ -108,7 +108,7 @@
           <li class="breadcrumb-item"><a href="../api.html">API</a></li>
       <li class="breadcrumb-item active">aaanalysis.load_dataset</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/generated/aaanalysis.load_dataset.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/generated/aaanalysis.load_dataset.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
@@ -120,10 +120,10 @@
 <h1>aaanalysis.load_dataset<a class="headerlink" href="#aaanalysis-load-dataset" title="Permalink to this heading"></a></h1>
 <dl class="py function">
 <dt class="sig sig-object py" id="aaanalysis.load_dataset">
-<span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">load_dataset</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">name</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'INFO'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">non_canonical_aa</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'remove'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">min_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/data_loader/data_loader.html#load_dataset"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/data_loader/data_loader.py#L58-L119"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.load_dataset" title="Permalink to this definition"></a></dt>
+<span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">load_dataset</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">name</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'INFO'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">non_canonical_aa</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'remove'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">min_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_len</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/data_loader/data_loader.py#L58-L119"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.load_dataset" title="Permalink to this definition"></a></dt>
 <dd><p>Load protein benchmarking datasets.</p>
-<p>The benchmarks are  distinguished into amino acid (‘AA’), domain (‘DOM’), and sequence (‘SEQ’) level
-datasets. Use default settings (name=’INFO’) of an overview table. Detailed analysis is in <a href="#id1"><span class="problematic" id="id2">:cite:`Breimann23a`</span></a>.</p>
+<p>The benchmarks are categorized into amino acid (‘AA’), domain (‘DOM’), and sequence (‘SEQ’) level
+datasets. Use default settings (<code class="docutils literal notranslate"><span class="pre">name='INFO'</span></code>) for an overview table. Detailed analysis is in <a class="reference internal" href="../index/references.html#breimann23a" id="id1"><span>[Breimann23a]</span></a>.</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters</dt>
 <dd class="field-odd"><ul class="simple">
@@ -141,10 +141,10 @@ <h1>aaanalysis.load_dataset<a class="headerlink" href="#aaanalysis-load-dataset"
 </ul>
 </dd>
 <dt class="field-even">Returns</dt>
-<dd class="field-even"><p>Dataframe with the selected sequence dataset.</p>
+<dd class="field-even"><p>Dataframe (df_seq) containing the selected sequence dataset.</p>
 </dd>
 <dt class="field-odd">Return type</dt>
-<dd class="field-odd"><p>df_seq</p>
+<dd class="field-odd"><p>pd.DataFrame</p>
 </dd>
 </dl>
 <div class="admonition-notes admonition">
diff --git a/docs/build/html/generated/aaanalysis.load_scales.html b/docs/build/html/generated/aaanalysis.load_scales.html
index 36cba888..38559bdf 100644
--- a/docs/build/html/generated/aaanalysis.load_scales.html
+++ b/docs/build/html/generated/aaanalysis.load_scales.html
@@ -108,7 +108,7 @@
           <li class="breadcrumb-item"><a href="../api.html">API</a></li>
       <li class="breadcrumb-item active">aaanalysis.load_scales</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/generated/aaanalysis.load_scales.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/generated/aaanalysis.load_scales.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
@@ -120,7 +120,7 @@
 <h1>aaanalysis.load_scales<a class="headerlink" href="#aaanalysis-load-scales" title="Permalink to this heading"></a></h1>
 <dl class="py function">
 <dt class="sig sig-object py" id="aaanalysis.load_scales">
-<span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">load_scales</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">name</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'scales'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">just_aaindex</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">unclassified_in</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/data_loader/data_loader.html#load_scales"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/data_loader/data_loader.py#L138-L172"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.load_scales" title="Permalink to this definition"></a></dt>
+<span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">load_scales</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">name</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'scales'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">just_aaindex</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">unclassified_in</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/data_loader/data_loader.py#L138-L172"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.load_scales" title="Permalink to this definition"></a></dt>
 <dd><p>Load amino acid scales, scale classification (AAontology), or scale evaluation.</p>
 <p>A through analysis of the residue and sequence datasets can be found in TODO[Breimann23a].</p>
 <dl class="field-list simple">
diff --git a/docs/build/html/generated/aaanalysis.plot_gcfs.html b/docs/build/html/generated/aaanalysis.plot_gcfs.html
index 3fb86912..97d7d229 100644
--- a/docs/build/html/generated/aaanalysis.plot_gcfs.html
+++ b/docs/build/html/generated/aaanalysis.plot_gcfs.html
@@ -111,7 +111,7 @@
           <li class="breadcrumb-item"><a href="../api.html">API</a></li>
       <li class="breadcrumb-item active">aaanalysis.plot_gcfs</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/generated/aaanalysis.plot_gcfs.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/generated/aaanalysis.plot_gcfs.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
@@ -123,7 +123,7 @@
 <h1>aaanalysis.plot_gcfs<a class="headerlink" href="#aaanalysis-plot-gcfs" title="Permalink to this heading"></a></h1>
 <dl class="py function">
 <dt class="sig sig-object py" id="aaanalysis.plot_gcfs">
-<span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">plot_gcfs</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/plotting/plotting_functions.html#plot_gcfs"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/plotting/plotting_functions.py#L317-L322"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.plot_gcfs" title="Permalink to this definition"></a></dt>
+<span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">plot_gcfs</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/plotting/plotting_functions.py#L317-L322"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.plot_gcfs" title="Permalink to this definition"></a></dt>
 <dd><p>Get current font size, which is set by ut.plot_settings function</p>
 </dd></dl>
 
diff --git a/docs/build/html/generated/aaanalysis.plot_get_cdict.html b/docs/build/html/generated/aaanalysis.plot_get_cdict.html
index 383fcbe3..bfa23fd0 100644
--- a/docs/build/html/generated/aaanalysis.plot_get_cdict.html
+++ b/docs/build/html/generated/aaanalysis.plot_get_cdict.html
@@ -111,7 +111,7 @@
           <li class="breadcrumb-item"><a href="../api.html">API</a></li>
       <li class="breadcrumb-item active">aaanalysis.plot_get_cdict</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/generated/aaanalysis.plot_get_cdict.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/generated/aaanalysis.plot_get_cdict.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
@@ -123,7 +123,7 @@
 <h1>aaanalysis.plot_get_cdict<a class="headerlink" href="#aaanalysis-plot-get-cdict" title="Permalink to this heading"></a></h1>
 <dl class="py function">
 <dt class="sig sig-object py" id="aaanalysis.plot_get_cdict">
-<span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">plot_get_cdict</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">name</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/plotting/plotting_functions.html#plot_get_cdict"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/plotting/plotting_functions.py#L169-L186"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.plot_get_cdict" title="Permalink to this definition"></a></dt>
+<span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">plot_get_cdict</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">name</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/plotting/plotting_functions.py#L169-L186"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.plot_get_cdict" title="Permalink to this definition"></a></dt>
 <dd><p>Retrieve color dictionaries specified for AAanalysis.</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters</dt>
diff --git a/docs/build/html/generated/aaanalysis.plot_get_cmap.html b/docs/build/html/generated/aaanalysis.plot_get_cmap.html
index 53df4320..21b5fc87 100644
--- a/docs/build/html/generated/aaanalysis.plot_get_cmap.html
+++ b/docs/build/html/generated/aaanalysis.plot_get_cmap.html
@@ -111,7 +111,7 @@
           <li class="breadcrumb-item"><a href="../api.html">API</a></li>
       <li class="breadcrumb-item active">aaanalysis.plot_get_cmap</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/generated/aaanalysis.plot_get_cmap.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/generated/aaanalysis.plot_get_cmap.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
@@ -123,7 +123,7 @@
 <h1>aaanalysis.plot_get_cmap<a class="headerlink" href="#aaanalysis-plot-get-cmap" title="Permalink to this heading"></a></h1>
 <dl class="py function">
 <dt class="sig sig-object py" id="aaanalysis.plot_get_cmap">
-<span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">plot_get_cmap</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">name</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_colors</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">100</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">facecolor_dark</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">color_pos</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">color_neg</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">color_center</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">input</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'hex'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pct_gap</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pct_center</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/plotting/plotting_functions.html#plot_get_cmap"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/plotting/plotting_functions.py#L116-L166"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.plot_get_cmap" title="Permalink to this definition"></a></dt>
+<span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">plot_get_cmap</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">name</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_colors</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">100</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">facecolor_dark</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">color_pos</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">color_neg</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">color_center</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">input</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'hex'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pct_gap</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pct_center</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/plotting/plotting_functions.py#L116-L166"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.plot_get_cmap" title="Permalink to this definition"></a></dt>
 <dd><p>Retrieve color maps or color dictionaries specified for AAanalysis.</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters</dt>
diff --git a/docs/build/html/generated/aaanalysis.plot_set_legend.html b/docs/build/html/generated/aaanalysis.plot_set_legend.html
index 5eb952d8..a32cd14c 100644
--- a/docs/build/html/generated/aaanalysis.plot_set_legend.html
+++ b/docs/build/html/generated/aaanalysis.plot_set_legend.html
@@ -111,7 +111,7 @@
           <li class="breadcrumb-item"><a href="../api.html">API</a></li>
       <li class="breadcrumb-item active">aaanalysis.plot_set_legend</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/generated/aaanalysis.plot_set_legend.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/generated/aaanalysis.plot_set_legend.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
@@ -123,7 +123,7 @@
 <h1>aaanalysis.plot_set_legend<a class="headerlink" href="#aaanalysis-plot-set-legend" title="Permalink to this heading"></a></h1>
 <dl class="py function">
 <dt class="sig sig-object py" id="aaanalysis.plot_set_legend">
-<span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">plot_set_legend</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">ax</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">handles</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dict_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">list_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labels</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">y</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">-0.2</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">x</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ncol</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">3</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fontsize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">11</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">weight</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'normal'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">lw</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">edgecolor</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">return_handles</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">loc</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'upper</span> <span class="pre">left'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labelspacing</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.2</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">columnspacing</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">title</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fontsize_legend</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">title_align_left</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fontsize_weight</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'normal'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">shape</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/plotting/plotting_functions.html#plot_set_legend"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/plotting/plotting_functions.py#L325-L434"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.plot_set_legend" title="Permalink to this definition"></a></dt>
+<span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">plot_set_legend</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">ax</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">handles</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dict_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">list_cat</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labels</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">y</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">-0.2</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">x</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ncol</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">3</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fontsize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">11</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">weight</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'normal'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">lw</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">edgecolor</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">return_handles</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">loc</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'upper</span> <span class="pre">left'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">labelspacing</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.2</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">columnspacing</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">title</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fontsize_legend</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">title_align_left</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fontsize_weight</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'normal'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">shape</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/plotting/plotting_functions.py#L325-L434"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.plot_set_legend" title="Permalink to this definition"></a></dt>
 <dd><p>Set a customizable legend for a plot.</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters</dt>
diff --git a/docs/build/html/generated/aaanalysis.plot_settings.html b/docs/build/html/generated/aaanalysis.plot_settings.html
index fa5a60f3..8d2b600b 100644
--- a/docs/build/html/generated/aaanalysis.plot_settings.html
+++ b/docs/build/html/generated/aaanalysis.plot_settings.html
@@ -111,7 +111,7 @@
           <li class="breadcrumb-item"><a href="../api.html">API</a></li>
       <li class="breadcrumb-item active">aaanalysis.plot_settings</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/generated/aaanalysis.plot_settings.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/generated/aaanalysis.plot_settings.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
@@ -123,7 +123,7 @@
 <h1>aaanalysis.plot_settings<a class="headerlink" href="#aaanalysis-plot-settings" title="Permalink to this heading"></a></h1>
 <dl class="py function">
 <dt class="sig sig-object py" id="aaanalysis.plot_settings">
-<span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">plot_settings</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">fig_format</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'pdf'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid_axis</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'y'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">font_scale</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.7</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">font</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'Arial'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">change_size</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">weight_bold</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">adjust_elements</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">short_ticks</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">no_ticks</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">no_ticks_y</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">short_ticks_y</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">no_ticks_x</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">short_ticks_x</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/aaanalysis/plotting/plotting_functions.html#plot_settings"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/plotting/plotting_functions.py#L189-L314"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.plot_settings" title="Permalink to this definition"></a></dt>
+<span class="sig-prename descclassname"><span class="pre">aaanalysis.</span></span><span class="sig-name descname"><span class="pre">plot_settings</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">fig_format</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'pdf'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid_axis</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'y'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">font_scale</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.7</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">font</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'Arial'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">change_size</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">weight_bold</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">adjust_elements</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">short_ticks</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">no_ticks</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">no_ticks_y</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">short_ticks_y</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">no_ticks_x</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">short_ticks_x</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference external" href="https://github.com/breimanntools/aaanalysis/tree/master/aaanalysis/plotting/plotting_functions.py#L189-L314"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#aaanalysis.plot_settings" title="Permalink to this definition"></a></dt>
 <dd><p>Configure general settings for plot visualization with various customization options.</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters</dt>
diff --git a/docs/build/html/genindex.html b/docs/build/html/genindex.html
index a969bf1e..7310caee 100644
--- a/docs/build/html/genindex.html
+++ b/docs/build/html/genindex.html
@@ -84,6 +84,7 @@
       <li><a href="index.html" class="icon icon-home"></a></li>
       <li class="breadcrumb-item active">Index</li>
       <li class="wy-breadcrumbs-aside">
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/genindex" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
diff --git a/docs/build/html/index.html b/docs/build/html/index.html
index 5e8dfb81..ee496608 100644
--- a/docs/build/html/index.html
+++ b/docs/build/html/index.html
@@ -96,7 +96,7 @@
       <li><a href="#" class="icon icon-home"></a></li>
       <li class="breadcrumb-item active">Welcome to the AAanalysis documentation</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="_sources/index.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/index.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
diff --git a/docs/build/html/index/CONTRIBUTING_COPY.html b/docs/build/html/index/CONTRIBUTING_COPY.html
index b9323b76..352b8451 100644
--- a/docs/build/html/index/CONTRIBUTING_COPY.html
+++ b/docs/build/html/index/CONTRIBUTING_COPY.html
@@ -123,7 +123,7 @@
       <li><a href="../index.html" class="icon icon-home"></a></li>
       <li class="breadcrumb-item active">Contributing</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/index/CONTRIBUTING_COPY.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/index/CONTRIBUTING_COPY.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
diff --git a/docs/build/html/index/citations.html b/docs/build/html/index/citations.html
index 6089e459..7d784b94 100644
--- a/docs/build/html/index/citations.html
+++ b/docs/build/html/index/citations.html
@@ -95,7 +95,7 @@
       <li><a href="../index.html" class="icon icon-home"></a></li>
       <li class="breadcrumb-item active">&lt;no title&gt;</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/index/citations.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/index/citations.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
diff --git a/docs/build/html/index/introduction.html b/docs/build/html/index/introduction.html
index 604e8200..ac26421c 100644
--- a/docs/build/html/index/introduction.html
+++ b/docs/build/html/index/introduction.html
@@ -100,7 +100,7 @@
       <li><a href="../index.html" class="icon icon-home"></a></li>
       <li class="breadcrumb-item active">Introduction</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/index/introduction.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/index/introduction.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
diff --git a/docs/build/html/index/references.html b/docs/build/html/index/references.html
index fd44f572..f9037e9d 100644
--- a/docs/build/html/index/references.html
+++ b/docs/build/html/index/references.html
@@ -102,7 +102,7 @@
       <li><a href="../index.html" class="icon icon-home"></a></li>
       <li class="breadcrumb-item active">References</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/index/references.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/index/references.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
diff --git a/docs/build/html/index/tables_template.html b/docs/build/html/index/tables_template.html
index 84299ac3..641ebde2 100644
--- a/docs/build/html/index/tables_template.html
+++ b/docs/build/html/index/tables_template.html
@@ -95,7 +95,7 @@
       <li><a href="../index.html" class="icon icon-home"></a></li>
       <li class="breadcrumb-item active">Tables</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/index/tables_template.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/index/tables_template.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
diff --git a/docs/build/html/index/usage_principles.html b/docs/build/html/index/usage_principles.html
index 95eaee2c..18b57c35 100644
--- a/docs/build/html/index/usage_principles.html
+++ b/docs/build/html/index/usage_principles.html
@@ -97,7 +97,7 @@
       <li><a href="../index.html" class="icon icon-home"></a></li>
       <li class="breadcrumb-item active">Usage Principles</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="../_sources/index/usage_principles.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/index/usage_principles.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
diff --git a/docs/build/html/searchindex.js b/docs/build/html/searchindex.js
index c01f366a..789551af 100644
--- a/docs/build/html/searchindex.js
+++ b/docs/build/html/searchindex.js
@@ -1 +1 @@
-Search.setIndex({"docnames": ["_index/badges", "_index/overview", "_index/tables", "_index/usage_principles/data_loading", "api", "generated/aaanalysis.AAclust", "generated/aaanalysis.CPP", "generated/aaanalysis.CPPPlot", "generated/aaanalysis.SequenceFeature", "generated/aaanalysis.dPULearn", "generated/aaanalysis.load_dataset", "generated/aaanalysis.load_scales", "generated/aaanalysis.plot_gcfs", "generated/aaanalysis.plot_get_cdict", "generated/aaanalysis.plot_get_cmap", "generated/aaanalysis.plot_set_legend", "generated/aaanalysis.plot_settings", "index", "index/CONTRIBUTING_COPY", "index/citations", "index/introduction", "index/references", "index/tables_template", "index/usage_principles", "tutorials"], "filenames": ["_index/badges.rst", "_index/overview.rst", "_index/tables.rst", "_index/usage_principles/data_loading.rst", "api.rst", "generated/aaanalysis.AAclust.rst", "generated/aaanalysis.CPP.rst", "generated/aaanalysis.CPPPlot.rst", "generated/aaanalysis.SequenceFeature.rst", "generated/aaanalysis.dPULearn.rst", "generated/aaanalysis.load_dataset.rst", "generated/aaanalysis.load_scales.rst", "generated/aaanalysis.plot_gcfs.rst", "generated/aaanalysis.plot_get_cdict.rst", "generated/aaanalysis.plot_get_cmap.rst", "generated/aaanalysis.plot_set_legend.rst", "generated/aaanalysis.plot_settings.rst", "index.rst", "index/CONTRIBUTING_COPY.rst", "index/citations.rst", "index/introduction.rst", "index/references.rst", "index/tables_template.rst", "index/usage_principles.rst", "tutorials.rst"], "titles": ["&lt;no title&gt;", "&lt;no title&gt;", "Tables", "Data Loading", "API", "aaanalysis.AAclust", "aaanalysis.CPP", "aaanalysis.CPPPlot", "aaanalysis.SequenceFeature", "aaanalysis.dPULearn", "aaanalysis.load_dataset", "aaanalysis.load_scales", "aaanalysis.plot_gcfs", "aaanalysis.plot_get_cdict", "aaanalysis.plot_get_cmap", "aaanalysis.plot_set_legend", "aaanalysis.plot_settings", "Welcome to the AAanalysis documentation", "Contributing", "&lt;no title&gt;", "Introduction", "References", "Tables", "Usage Principles", "Tutorials"], "terms": {"aaanalysi": [1, 4, 18, 19, 20, 22, 23], "amino": [1, 3, 5, 6, 7, 8, 10, 11, 17, 19, 20, 21, 22], "acid": [1, 3, 5, 6, 7, 8, 10, 11, 17, 19, 20, 21, 22], "analysi": [1, 9, 10, 11, 17, 18, 20], "i": [1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 17, 18, 20], "python": [1, 17, 18, 20], "framework": [1, 5, 17, 20], "interpret": [1, 14, 17, 18, 19, 20, 21], "sequenc": [1, 2, 3, 6, 7, 8, 9, 10, 11, 17, 18, 20, 21], "base": [1, 5, 6, 7, 8, 9, 14, 17, 18, 20, 21], "protein": [1, 7, 8, 10, 17, 18, 20, 21], "predict": [1, 2, 3, 17, 18, 20, 21], "provid": [1, 3, 5, 6, 7, 9, 11, 14, 17, 18], "follow": [1, 3, 4, 5, 6, 8, 9, 17, 18, 19, 20], "algorithm": [1, 6, 7, 17, 18, 20], "aaclust": [1, 17, 19, 20, 21, 24], "k": [1, 5, 17, 20, 21], "optim": [1, 5, 6, 7, 17, 20, 21], "cluster": [1, 5, 17, 20, 21], "wrapper": [1, 7, 17, 18, 20], "select": [1, 5, 6, 7, 10, 11, 17, 20, 21], "redund": [1, 5, 6, 17, 20, 21], "reduc": [1, 5, 9, 17, 20, 21], "set": [1, 2, 5, 6, 7, 8, 9, 10, 12, 15, 16, 17, 18, 20, 21], "numer": [1, 5, 7, 8, 17, 20], "scale": [1, 5, 6, 7, 8, 11, 13, 14, 16, 17, 19, 20, 21, 22], "e": [1, 3, 7, 8, 13, 14, 16, 17, 18, 20], "g": [1, 3, 7, 8, 13, 14, 16, 17, 18, 20], "cpp": [1, 7, 8, 14, 17, 19, 20, 24], "compar": [1, 17, 20], "physicochem": [1, 6, 8, 17, 20, 21], "profil": [1, 7, 13, 14, 17, 20], "featur": [1, 5, 6, 7, 8, 9, 14, 17, 18, 20], "engin": [1, 17, 18, 20], "two": [1, 6, 7, 17, 18, 20, 21], "identifi": [1, 6, 7, 9, 17, 20, 21], "most": [1, 5, 6, 7, 9, 17, 20], "distinct": [1, 8, 17, 20], "dpulearn": [1, 17, 19, 20, 24], "determinist": [1, 9, 17, 20], "posit": [1, 2, 3, 5, 6, 7, 8, 9, 14, 17, 20], "unlabel": [1, 3, 9, 17, 20], "pu": [1, 2, 3, 9, 17, 20], "learn": [1, 3, 5, 9, 17, 18, 19, 20, 21], "enabl": [1, 5, 6, 7, 8, 9, 16, 17, 18, 20], "train": [1, 17, 18, 20], "unbalanc": [1, 17, 18, 20], "small": [1, 9, 17, 18, 20], "dataset": [1, 3, 5, 6, 10, 11, 17, 18, 20], "moreov": [1, 17], "function": [1, 4, 7, 12, 14, 16, 17], "load": [1, 10, 11, 17, 18], "benchmark": [1, 3, 10, 17], "load_data": [1, 17], "load_scal": [1, 2, 8, 17, 22], "depth": [1, 17], "level": [1, 2, 7, 10, 17], "classif": [1, 2, 3, 7, 11, 17], "aaontologi": [1, 2, 11, 17, 19, 21], "descript": [2, 18, 22], "see": [2, 3, 7, 10, 18, 22], "also": [2, 3, 9, 18, 22], "1_overview_benchmark": 2, "aa": [2, 3, 4, 6, 8, 9, 10, 15, 16, 22, 23], "load_dataset": [2, 4, 8, 22], "2_overview_scal": 2, "neg": [2, 5, 8, 9, 14], "predictor": 2, "refer": [2, 4, 5, 6, 8], "label": [2, 5, 6, 7, 8, 9, 15, 18], "aa_caspase3": 2, "233": 2, "185605": 2, "705": 2, "184900": 2, "prosper": [2, 21], "caspas": 2, "3": [2, 5, 8, 9, 15, 18], "cleavag": [2, 21], "site": [2, 21], "song18": [2, 21], "1": [2, 3, 5, 6, 7, 8, 9, 15, 16], "adjac": 2, "0": [2, 5, 6, 7, 8, 9, 15, 16], "aa_furin": 2, "71": 2, "59003": 2, "163": 2, "58840": 2, "furin": 2, "aa_ldr": [2, 3], "342": 2, "118248": 2, "35469": 2, "82779": 2, "idp": [2, 21], "seq2seq": [2, 21], "long": 2, "intrins": [2, 21], "disord": [2, 21], "region": [2, 21], "ldr": 2, "tang20": [2, 21], "order": [2, 5, 22], "aa_mmp2": 2, "573": 2, "312976": 2, "2416": 2, "310560": 2, "matrix": [2, 5, 8, 9], "metallopeptidas": 2, "2": [2, 3, 5, 6, 7, 8, 9, 15], "mmp2": 2, "aa_rnabind": 2, "221": 2, "55001": 2, "6492": 2, "48509": 2, "gmksvm": 2, "ru": 2, "rna": [2, 21], "bind": [2, 21], "residu": [2, 3, 11, 21], "rbp60": 2, "yang21": [2, 21], "non": [2, 6, 8, 10], "aa_sa": 2, "101082": 2, "84523": 2, "solvent": 2, "access": [2, 4], "sa": 2, "data": [2, 5, 7, 9, 17, 18], "expos": 2, "buri": 2, "seq_amylo": [2, 3], "1414": 2, "8484": 2, "511": 2, "903": 2, "rerf": [2, 21], "pred": [2, 21], "amyloidognen": 2, "teng21": [2, 21], "amyloidogen": [2, 21], "seq_capsid": 2, "7935": 2, "3364680": 2, "3864": 2, "4071": 2, "viralpro": [2, 21], "capdsid": 2, "galiez16": [2, 21], "capsid": [2, 21], "seq_disulfid": 2, "2547": 2, "614470": 2, "897": 2, "1650": 2, "dipro": 2, "disulfid": 2, "bridg": [2, 21], "cheng06": [2, 21], "ss": 2, "bond": 2, "without": [2, 5, 7, 18], "seq_loc": 2, "1835": 2, "732398": 2, "1045": 2, "790": 2, "nan": 2, "subcellular": [2, 21], "locat": [2, 15], "cytoplasm": 2, "v": 2, "plasma": 2, "membran": [2, 8], "shen19": [2, 21], "seq_solubl": 2, "17408": 2, "4432269": 2, "8704": 2, "solpro": [2, 21], "solubl": [2, 21], "insolubl": 2, "magnan09": [2, 21], "seq_tail": 2, "6668": 2, "2671690": 2, "2574": 2, "4094": 2, "tail": [2, 21], "domain": [2, 3, 8, 10], "dom_gsec": [2, 3], "126": 2, "92964": 2, "63": 2, "gamma": 2, "secretas": [2, 21], "substrat": [2, 21], "breimann23c": [2, 21], "dom_gsec_pu": [2, 3], "694": 2, "494524": 2, "unknown": 2, "statu": 2, "min": 2, "max": 2, "normal": [2, 7, 15], "586": 2, "breimann23b": [2, 17, 19, 21], "scales_raw": [2, 11], "raw": 2, "valu": [2, 5, 6, 7, 8, 18, 20], "kawashima08": [2, 21], "scales_classif": 2, "scales_pc": [2, 11], "princip": [2, 9], "compon": [2, 8, 9], "pc": [2, 9], "compress": 2, "20": [2, 6, 7, 8, 18], "breimann23a": [2, 10, 11, 21], "top60": [2, 11], "top": [2, 5], "60": 2, "subset": [2, 8], "top60_ev": [2, 11], "evalu": [2, 6, 11, 18], "three": [3, 5, 8, 14], "type": [3, 5, 6, 7, 8, 9, 10, 11, 13, 14, 15, 18], "ar": [3, 6, 7, 8, 9, 10, 11, 18, 22], "us": [3, 5, 6, 7, 9, 10, 14, 16, 17, 18, 19, 20], "specif": [3, 5, 13], "properti": [3, 8], "dom": [3, 10], "seq": [3, 10], "The": [3, 5, 6, 7, 8, 9, 10, 11, 13, 14, 15, 18], "each": [3, 5, 6, 7, 8, 9], "indic": [3, 5, 7, 8, 9], "first": [3, 6, 7, 8, 14, 18], "part": [3, 6, 7, 8, 18], "name": [3, 5, 6, 7, 8, 9, 10, 11, 13, 14, 16], "an": [3, 9, 10, 17, 18, 19, 21], "abbrevi": 3, "For": [3, 4, 5, 8, 15, 18], "some": 3, "addit": [3, 7, 8, 9, 15, 16], "version": 3, "contain": [3, 4, 6, 7, 9, 10, 18], "onli": [3, 7, 11, 18], "sampl": [3, 5, 6, 7, 8, 9], "dataset_nam": 3, "_pu": 3, "thi": [4, 5, 7, 16, 18], "page": [4, 17], "public": [4, 17, 18, 19], "object": [4, 5, 7, 8, 9], "more": [4, 7, 18], "exampl": [4, 18], "practic": 4, "usag": [4, 17], "our": [4, 18], "notebook": [4, 24], "conveni": 4, "common": [4, 18], "import": [4, 8, 9, 15, 16, 18, 23], "modul": [4, 5, 17], "Then": 4, "you": [4, 17, 18, 19], "can": [4, 5, 8, 9, 11, 15, 17, 18, 20], "all": [4, 5, 6, 7, 8, 16, 18, 22], "method": [4, 5, 6, 7, 8, 9, 21], "via": [4, 18, 21], "alia": [4, 8], "class": [5, 6, 7, 8, 9, 10], "model": [5, 9, 18], "none": [5, 6, 7, 8, 9, 10, 13, 14, 15], "model_kwarg": 5, "verbos": [5, 6, 7, 8, 9, 16], "fals": [5, 6, 7, 8, 9, 11, 14, 15, 16], "sourc": [5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18], "A": [5, 8, 11, 15, 18, 20, 21], "design": [5, 7, 18], "primarili": [5, 9, 18], "versatil": 5, "enough": 5, "ani": [5, 18, 20], "It": [5, 20], "take": 5, "requir": 5, "pre": [5, 6, 18], "defin": [5, 8, 18], "number": [5, 6, 7, 8, 9, 10, 14, 15], "from": [5, 6, 7, 8, 9, 11, 17, 18, 22], "scikit": [5, 18], "http": [5, 18], "org": [5, 18], "stabl": 5, "html": [5, 18], "By": 5, "leverag": 5, "pearson": [5, 6], "correl": [5, 6], "similar": 5, "measur": [5, 18], "one": [5, 7], "repres": [5, 7, 20], "term": 5, "medoid": 5, "which": [5, 7, 8, 12, 20], "closest": 5, "": [5, 15, 21], "center": [5, 14], "yield": 5, "paramet": [5, 6, 7, 8, 9, 10, 11, 13, 14, 15, 16], "callabl": 5, "option": [5, 6, 7, 8, 9, 10, 11, 14, 16], "default": [5, 6, 7, 8, 9, 10, 11, 13, 14, 15, 16], "sklearn": 5, "kmean": 5, "emploi": [5, 9], "given": [5, 7, 8, 11, 22], "n_cluster": 5, "dict": [5, 6, 7, 8, 9, 13, 14, 15], "dictionari": [5, 6, 7, 8, 13, 14, 15], "keyword": [5, 7, 9], "argument": [5, 7, 8, 9, 15], "pass": [5, 7, 9, 15, 18], "bool": [5, 6, 7, 8, 9, 11, 14, 15, 16], "flag": 5, "disabl": [5, 10], "output": [5, 8, 9, 16], "obtain": [5, 8], "int": [5, 6, 7, 8, 9, 10, 14, 15], "labels_": [5, 9], "arrai": [5, 6, 8, 9], "like": [5, 6, 8, 9, 18], "centers_": 5, "averag": [5, 8], "correspond": [5, 18], "center_labels_": 5, "medoids_": 5, "medoid_labels_": 5, "medoid_ind_": 5, "chosen": [5, 6, 8], "within": [5, 6, 8], "origin": 5, "__init__": [5, 6, 7, 8, 9], "fit": [5, 9, 18], "x": [5, 7, 9, 10, 15, 16], "on_cent": 5, "true": [5, 6, 7, 8, 11, 15, 16], "min_th": 5, "merge_metr": 5, "euclidean": [5, 9], "format": [5, 16], "determin": 5, "partit": 5, "maxim": 5, "beyond": 5, "threshold": [5, 6], "qualiti": 5, "either": [5, 8, 17], "minimum": [5, 8, 10], "member": 5, "min_cor": 5, "between": [5, 6, 7, 8, 14, 15], "its": [5, 18], "govern": 5, "undergo": 5, "stage": 5, "estim": 5, "lower": 5, "bound": 5, "refin": 5, "metric": [5, 9, 18], "merg": 5, "smaller": 5, "direct": 5, "final": 5, "reduct": 5, "shape": [5, 6, 7, 8, 9, 15], "n_sampl": [5, 6, 8, 9], "n_featur": [5, 6, 7, 8, 9], "where": [5, 8, 9], "list": [5, 7, 8, 14, 15], "str": [5, 7, 8, 9, 10, 11, 13, 14, 15, 16], "If": [5, 6, 7, 8, 9, 10, 14, 16, 17, 18, 19], "return": [5, 6, 7, 8, 9, 10, 11, 13, 14, 15], "appli": [5, 9, 14, 15, 16], "otherwis": [5, 7, 8, 9], "float": [5, 6, 7, 9, 14, 15, 16], "instead": 5, "names_medoid": 5, "attribut": 5, "attr": 5, "further": [5, 7, 10, 18], "inform": [5, 6, 7, 8, 9, 10], "paper": 5, "todo": [5, 6, 11], "add": [5, 6, 7, 8], "link": [5, 6, 17, 18, 19, 21], "cluster_nam": 5, "name_unclassifi": 5, "unclassifi": [5, 11], "assign": [5, 7, 8, 9], "frequenc": 5, "renam": 5, "prioriti": 5, "frequent": 5, "alreadi": 5, "doe": 5, "exist": [5, 18], "cannot": 5, "classifi": [5, 7], "static": [5, 6, 8], "get_cluster_cent": 5, "comput": [5, 6, 7, 8, 18, 21], "center_label": 5, "associ": 5, "get_cluster_medoid": 5, "medoid_label": 5, "medoid_ind": 5, "index": [5, 17, 18, 21], "x_test": 5, "x_ref": 5, "labels_test": 5, "labels_ref": 5, "n": [5, 6, 7, 8, 10, 18, 21], "except_unclassifi": 5, "test": [5, 6], "consid": [5, 18], "strength": 5, "els": 5, "exclud": 5, "list_top_center_name_corr": 5, "have": [5, 18], "strongest": 5, "eval": [5, 6, 9, 18], "df_scale": [6, 8], "df_cat": [6, 7, 8], "df_part": [6, 8], "split_kw": [6, 8], "accept_gap": [6, 7, 8], "tool": [6, 18, 21], "creat": [6, 7, 8, 9, 18], "filter": [6, 7, 10], "discrimin": [6, 7], "panda": [6, 7, 8, 9, 11, 18], "datafram": [6, 7, 8, 9, 10, 11, 18], "load_categori": [6, 8], "categori": [6, 7, 8, 11, 13, 14, 15], "sequencefeatur": 6, "get_split_kw": [6, 8], "nest": [6, 8], "split_typ": [6, 8], "whether": [6, 7, 8, 11, 14, 15], "accept": [6, 7, 8], "miss": [6, 7, 8], "omit": [6, 7, 8], "print": [6, 7, 8], "progress": [6, 7, 21], "about": [6, 7], "run": [6, 8], "perform": [6, 9], "step": [6, 7, 8, 20], "parametr": 6, "n_filter": 6, "100": [6, 14], "tmd_len": [6, 7, 8], "jmd_n_len": [6, 7, 8], "10": [6, 7, 8, 14], "jmd_c_len": [6, 7, 8], "ext_len": [6, 7, 8], "4": [6, 7, 8], "start": [6, 7, 8, 18], "check_cat": 6, "n_pre_filt": 6, "pct_pre_filt": 6, "5": [6, 7, 8, 9, 15], "max_std_test": 6, "max_overlap": 6, "max_cor": 6, "n_process": 6, "pipelin": [6, 18], "creation": 6, "aim": [6, 7, 18], "collect": 6, "group": [6, 7, 8], "t": 6, "u": [6, 17, 18], "p": [6, 21], "percentag": [6, 9, 14], "length": [6, 7, 8, 10], "tmd": [6, 7, 8], "explan": [6, 7], "terminu": [6, 7, 8], "jmd": [6, 7, 8], "c": [6, 7, 8, 17, 21], "extend": [6, 7, 8, 18], "termin": [6, 7, 8], "should": [6, 7, 8, 9, 11, 18], "longer": 6, "than": 6, "check": [6, 18], "remain": [6, 18], "after": 6, "maximum": [6, 8, 9, 10], "standard": 6, "deviat": 6, "overlap": 6, "cpu": 6, "multiprocess": 6, "automat": [6, 7, 9, 18], "df_feat": [6, 7, 8], "uniqu": [6, 7], "statist": [6, 7], "n_feature_inform": [6, 7], "eleven": 6, "column": [6, 7, 8, 9, 10, 15, 18], "includ": [6, 8, 11, 14, 15, 18], "id": [6, 8], "result": 6, "rank": 6, "11": [6, 7, 15], "split": [6, 8], "subcategori": [6, 7], "sub": 6, "scale_nam": [6, 7], "abs_auc": [6, 7], "absolut": 6, "adjust": [6, 7, 16], "auc": 6, "abs_mean_dif": 6, "mean": [6, 7], "differ": [6, 7, 8, 15], "std_test": [6, 7], "std_ref": 6, "p_val": 6, "mann_whitnei": 6, "ttest_indep": 6, "p_val_fdr_bh": 6, "benjamini": 6, "hochberg": 6, "fdr": 6, "correct": 6, "get": [6, 8, 12], "condit": [7, 8], "jmd_m_len": [7, 8], "y": [7, 15, 16], "val_col": 7, "mean_dif": 7, "val_typ": 7, "count": [7, 11], "figsiz": 7, "7": [7, 8, 9, 16], "titl": [7, 15], "title_kw": 7, "dict_color": [7, 13, 14, 15], "edge_color": 7, "bar_width": 7, "75": 7, "add_jmd_tmd": 7, "jmd_n_seq": 7, "tmd_seq": 7, "jmd_c_seq": 7, "tmd_color": 7, "mediumspringgreen": 7, "jmd_color": 7, "blue": [7, 15], "tmd_seq_color": 7, "black": [7, 18], "jmd_seq_color": 7, "white": 7, "seq_siz": 7, "tmd_jmd_fontsiz": 7, "xtick_siz": 7, "xtick_width": 7, "xtick_length": 7, "xticks_po": 7, "ytick_siz": 7, "ytick_width": 7, "ytick_length": 7, "ylim": 7, "highlight_tmd_area": 7, "highlight_alpha": 7, "15": [7, 8], "grid": [7, 16], "grid_axi": [7, 16], "both": [7, 16], "add_legend_cat": 7, "legend_kw": 7, "shap_plot": 7, "kwarg": [7, 8, 15], "plot": [7, 13, 14, 15, 16, 17, 18], "instanc": 7, "avail": [7, 17, 19, 21], "specifi": [7, 8, 9, 13, 14, 16, 18], "check_value_typ": 7, "tupl": [7, 14], "size": [7, 8, 12, 14, 15, 16], "custom": [7, 15, 16], "appear": [7, 16], "map": [7, 8, 14, 15], "color": [7, 13, 14, 15], "edg": [7, 15, 18], "bar": [7, 13, 14], "width": [7, 15], "line": [7, 15], "annot": 7, "font": [7, 12, 15, 16], "tick": [7, 16], "axi": [7, 16], "limit": 7, "highlight": 7, "area": 7, "alpha": 7, "ad": 7, "drawn": 7, "legend": [7, 15], "shap": [7, 14, 18], "shaplei": 7, "gener": [7, 8, 14, 16, 18, 20, 21], "other": [7, 11, 18], "intern": 7, "librari": [7, 16, 18], "ax": [7, 15], "matplotlib": [7, 15, 16, 18], "heatmap": [7, 13, 14], "8": [7, 8, 9, 18], "vmin": 7, "vmax": 7, "grid_on": 7, "cmap": [7, 13, 14], "rdbu_r": 7, "cmap_n_color": 7, "cbar_kw": 7, "facecolor_dark": [7, 14], "add_importance_map": 7, "cbar_pct": 7, "featuremap": 7, "versu": 7, "seaborn": [7, 14, 16, 18], "shown": 7, "feat_impact": 7, "displai": 7, "sum": 7, "std": 7, "aggreg": 7, "positions_onli": 7, "across": 7, "recommend": [7, 9, 18], "when": [7, 9], "emphas": [7, 18], "fewer": 7, "value_typ": 7, "height": 7, "figur": 7, "inch": 7, "pyplot": [7, 15], "anchor": [7, 15], "colormap": 7, "infer": [7, 18], "seismic": 7, "space": [7, 9, 14, 15], "impact": 7, "discret": 7, "diverg": 7, "sequenti": 7, "kei": [7, 18], "colorbar": 7, "under": [7, 18], "depicet": 7, "depict": 7, "jmd_n": [7, 8], "jmd_c": [7, 8], "point": [7, 15], "set_xticklabel": 7, "widht": 7, "tick_param": 7, "pcolormesh": 7, "effect": [7, 18], "align": [7, 15], "applic": 7, "document": [7, 22], "detail": [7, 10, 15, 17, 18, 19], "code": [7, 14], "update_seq_s": 7, "retriev": [8, 13, 14], "continu": 8, "transmembran": 8, "principl": [8, 17], "segment": 8, "pattern": 8, "express": 8, "present": 8, "realiz": 8, "over": 8, "valid": [8, 18], "tmd_e": 8, "tmd_n": 8, "tmd_c": 8, "ext_c": 8, "ext_n": 8, "tmd_jmd": 8, "jmd_n_tmd_n": 8, "tmd_c_jmd_c": 8, "ext_n_tmd_n": 8, "tmd_c_ext_c": 8, "get_df_part": 8, "df_seq": [8, 9, 10], "list_part": 8, "all_part": 8, "datafran": 8, "compris": 8, "tmd_start": 8, "tmd_stop": 8, "string": [8, 14], "len": 8, "must": 8, "lenght": 8, "resp": 8, "extra": 8, "possibl": 8, "found": [8, 11, 18], "sf": 8, "gsec_sub_seq": 8, "n_split_min": 8, "n_split_max": 8, "steps_pattern": 8, "n_min": 8, "n_max": 8, "len_max": 8, "steps_periodicpattern": 8, "periodicpattern": 8, "greater": 8, "greatest": 8, "whole": [8, 10], "specfii": 8, "smallest": 8, "integ": 8, "6": 8, "vari": 8, "paramt": 8, "argumetn": 8, "get_featur": 8, "combin": [8, 18], "form": 8, "feat_matrix": 8, "n_job": 8, "return_label": 8, "pd": [8, 9, 18], "seri": 8, "job": 8, "parallel": 8, "spars": 8, "feat_nam": 8, "convert": 8, "depend": 8, "last": 8, "step1": 8, "step2": 8, "add_feat_valu": 8, "dict_scal": 8, "convent": 8, "letter": 8, "feature_valu": 8, "n_part": 8, "ha": [8, 18], "structur": [8, 21], "th": 8, "n_split": 8, "p1": 8, "p2": 8, "pn": 8, "end": 8, "odd": 8, "even": 8, "give": 8, "add_dif": 8, "sample_nam": 8, "ref_group": 8, "add_posit": 8, "part_split": 8, "feat_posit": 8, "total": [8, 9], "n_compon": 9, "pca_kwarg": 9, "offer": [9, 18], "approach": 9, "pca": 9, "dimension": [9, 21], "iter": 9, "reliabl": [9, 18], "These": [9, 18], "those": 9, "distant": 9, "altern": 9, "distanc": 9, "manhattan": 9, "cosin": 9, "80": 9, "cover": 9, "varianc": 9, "identif": [9, 21], "datapoint": 9, "inspir": [9, 18], "techniqu": 9, "theoret": 9, "high": [9, 21], "n_neg": 9, "label_po": 9, "name_neg": 9, "rel_neg": 9, "col_class": 9, "newli": 9, "updat": [9, 18], "new": [9, 18], "store": 9, "Will": 9, "dure": 9, "initi": 9, "datafor": 9, "conta": 9, "po": 9, "unl": 9, "numpi": [9, 18], "np": 9, "atgc": 9, "gcta": 9, "actg": 9, "tacg": 9, "mode": 9, "modifi": [9, 10, 16], "dpul": 9, "info": 10, "non_canonical_aa": 10, "remov": [10, 16], "min_len": 10, "max_len": 10, "distinguish": 10, "overview": 10, "tabl": 10, "cite": [10, 17, 19], "per": 10, "liter": 10, "keep": 10, "gap": [10, 14], "canon": 10, "do": 10, "replac": 10, "symbol": 10, "ref": 10, "just_aaindex": 11, "unclassified_in": 11, "through": 11, "scale_cat": 11, "relev": 11, "scale_classif": 11, "aaindex": [11, 21], "df": 11, "current": 12, "ut": 12, "plot_set": 12, "dict_scale_cat": [13, 14], "cppplot": [13, 14, 18], "respect": [13, 14, 17, 18, 19], "n_color": 14, "color_po": 14, "color_neg": 14, "color_cent": 14, "input": [14, 18], "hex": 14, "pct_gap": 14, "pct_center": 14, "palett": 14, "feat": 14, "ggplot": 14, "datagroup": 14, "dark": 14, "face": 14, "rgb": 14, "hl": 14, "husl": 14, "xkcd": 14, "latter": 14, "rang": 14, "sn": 14, "color_palett": 14, "light_palett": 14, "lighter": 14, "handl": 15, "list_cat": 15, "ncol": 15, "fontsiz": 15, "weight": [15, 21], "lw": 15, "edgecolor": 15, "return_handl": 15, "loc": 15, "upper": 15, "left": 15, "labelspac": 15, "columnspac": 15, "fontsize_legend": 15, "title_align_left": 15, "fontsize_weight": 15, "customiz": 15, "attach": 15, "item": 15, "coordin": 15, "text": [15, 16], "vertic": 15, "horizont": 15, "marker": 15, "directli": [15, 18], "finer": 15, "control": 15, "how": 15, "line2d": 15, "cat1": 15, "red": 15, "cat2": 15, "o": 15, "fig_format": 16, "pdf": 16, "font_scal": 16, "arial": 16, "change_s": 16, "weight_bold": 16, "adjust_el": 16, "short_tick": 16, "no_tick": 16, "no_ticks_i": 16, "short_ticks_i": 16, "no_ticks_x": 16, "short_ticks_x": 16, "configur": 16, "visual": [16, 18], "variou": [16, 18], "file": [16, 18], "save": 16, "make": [16, 18], "visibl": 16, "choos": 16, "san": 16, "serif": 16, "verdana": 16, "helvetica": 16, "dejavu": 16, "element": 16, "bold": 16, "layout": 16, "short": 16, "mark": 16, "global": 16, "pypi": 17, "conda": [17, 18], "forg": 17, "pip": [17, 18], "introduct": 17, "contribut": 17, "tutori": 17, "api": 17, "explain": [17, 18, 21], "ai": [17, 18, 21], "perturb": 17, "util": [17, 18], "search": 17, "your": [17, 18, 19], "work": [17, 19], "pleas": [17, 18, 19], "_": [17, 19], "breimann": [17, 19, 21], "kamp": [17, 19], "steiner": [17, 19], "frishman": [17, 19], "2023": [17, 19], "ontologi": [17, 19, 21], "machin": [17, 18, 19, 21], "biorxiv": [17, 19, 21], "welcom": 18, "thank": 18, "we": 18, "open": 18, "project": [18, 22], "focus": 18, "involv": 18, "invalu": 18, "made": 18, "wai": 18, "suggest": 18, "github": 18, "issu": 18, "tracker": 18, "submit": 18, "improv": [18, 21], "particip": 18, "discuss": 18, "newcom": 18, "tackl": 18, "good": 18, "email": 18, "stephanbreimann": 18, "gmail": 18, "com": 18, "question": 18, "establish": 18, "comprehens": 18, "toolkit": 18, "robust": 18, "life": 18, "scienc": 18, "integr": [18, 21], "seamlessli": 18, "flexibl": 18, "interoper": 18, "packag": 18, "biopython": 18, "reimplement": 18, "solut": 18, "ignor": 18, "biolog": [18, 20], "context": 18, "relianc": 18, "opaqu": 18, "box": 18, "empir": 18, "insight": 18, "cut": 18, "fair": 18, "account": 18, "transpar": 18, "re": [18, 21], "commit": 18, "divers": 18, "aspect": 18, "causal": 18, "minim": 18, "reproduc": 18, "mre": 18, "least": 18, "amount": 18, "demonstr": 18, "self": 18, "ensur": 18, "necessari": 18, "confirm": 18, "replic": 18, "guidelin": 18, "here": [18, 22], "To": 18, "git": 18, "breimanntool": 18, "master": 18, "repositori": 18, "your_usernam": 18, "navig": 18, "folder": 18, "up": 18, "cd": 18, "isol": 18, "aanalysi": 18, "9": 18, "activ": 18, "poetri": 18, "pytest": 18, "hypothesi": 18, "execut": 18, "case": 18, "directori": 18, "substanti": 18, "minor": 18, "typo": 18, "concis": 18, "clear": 18, "branch": 18, "fix": 18, "readm": 18, "date": 18, "readthedoc": 18, "crucial": 18, "modif": 18, "thei": 18, "render": 18, "correctli": 18, "strive": 18, "consist": [18, 20], "interfac": 18, "well": 18, "organ": 18, "codebas": 18, "standalon": 18, "focu": 18, "special": 18, "task": 18, "carri": 18, "out": 18, "complet": 18, "process": 18, "fulfil": 18, "purpos": 18, "being": 18, "implement": 18, "inherit": 18, "supplementari": 18, "accordingli": 18, "suffix": 18, "support": 18, "semi": 18, "strictli": 18, "adher": 18, "aforement": 18, "primari": 18, "_util": 18, "_utils_const": 18, "py": 18, "modular": 18, "easili": 18, "therefor": 18, "flat": 18, "hierarchi": 18, "program": 18, "outlin": 18, "softwar": 18, "user": 18, "friendli": 18, "hint": 18, "enhanc": 18, "propos": 18, "pep": 18, "484": 18, "book": 18, "error": 18, "messag": 18, "docstr": 18, "257": 18, "guid": 18, "markup": 18, "languag": 18, "restructuredtext": 18, "rst": 18, "primer": 18, "autodoc": 18, "sphinx": 18, "inclus": 18, "napoleon": 18, "extens": 18, "conf": 18, "go": 18, "_build": 18, "browser": 18, "citat": 19, "wa": 20, "develop": 20, "typic": 20, "et": 21, "al": 21, "2023a": 21, "2023b": 21, "2023c": 21, "chart": 21, "\u03b3": 21, "cheng": 21, "2006": 21, "larg": 21, "disulphid": 21, "kernel": 21, "recurs": 21, "neural": 21, "network": 21, "graph": 21, "match": 21, "struct": 21, "funct": 21, "kawashima": 21, "2008": 21, "aid": 21, "databas": 21, "report": 21, "nucleic": 21, "magnan": 21, "randal": 21, "baldi": 21, "2009": 21, "accur": 21, "bioinformat": 21, "galiez": 21, "2016": 21, "viral": 21, "song": 21, "2018": 21, "throughput": 21, "90": 21, "proteas": 21, "accuraci": 21, "shen": 21, "2019": 21, "local": 21, "evolutionari": 21, "chou": 21, "pseaac": 21, "j": 21, "theor": 21, "biol": 21, "tang": 21, "2020": 21, "teng": 21, "2021": 21, "pseudo": 21, "composit": 21, "tripeptid": 21, "bmc": 21, "yang": 21, "granular": 21, "multipl": 21, "appl": 21, "chronolog": 22, "histori": 22, "overview_benchmark": 22, "overview_scal": 22, "view": 24}, "objects": {"aaanalysis": [[5, 0, 1, "", "AAclust"], [6, 0, 1, "", "CPP"], [7, 0, 1, "", "CPPPlot"], [8, 0, 1, "", "SequenceFeature"], [9, 0, 1, "", "dPULearn"], [10, 3, 1, "", "load_dataset"], [11, 3, 1, "", "load_scales"], [12, 3, 1, "", "plot_gcfs"], [13, 3, 1, "", "plot_get_cdict"], [14, 3, 1, "", "plot_get_cmap"], [15, 3, 1, "", "plot_set_legend"], [16, 3, 1, "", "plot_settings"]], "aaanalysis.AAclust": [[5, 1, 1, "", "__init__"], [5, 2, 1, "", "center_labels_"], [5, 2, 1, "", "centers_"], [5, 1, 1, "", "cluster_naming"], [5, 1, 1, "", "correlation"], [5, 1, 1, "", "eval"], [5, 1, 1, "", "fit"], [5, 1, 1, "", "get_cluster_centers"], [5, 1, 1, "", "get_cluster_medoids"], [5, 2, 1, "", "labels_"], [5, 2, 1, "", "medoid_ind_"], [5, 2, 1, "", "medoid_labels_"], [5, 2, 1, "", "medoids_"], [5, 2, 1, "", "n_clusters"]], "aaanalysis.CPP": [[6, 1, 1, "", "__init__"], [6, 1, 1, "", "eval"], [6, 1, 1, "", "run"]], "aaanalysis.CPPPlot": [[7, 1, 1, "", "__init__"], [7, 1, 1, "", "heatmap"], [7, 1, 1, "", "profile"], [7, 1, 1, "", "update_seq_size"]], "aaanalysis.SequenceFeature": [[8, 1, 1, "", "__init__"], [8, 1, 1, "", "add_dif"], [8, 1, 1, "", "add_feat_value"], [8, 1, 1, "", "add_position"], [8, 1, 1, "", "feat_matrix"], [8, 1, 1, "", "feat_names"], [8, 1, 1, "", "get_df_parts"], [8, 1, 1, "", "get_features"], [8, 1, 1, "", "get_split_kws"]], "aaanalysis.dPULearn": [[9, 1, 1, "", "__init__"], [9, 1, 1, "", "eval"], [9, 1, 1, "", "fit"], [9, 2, 1, "", "labels_"]]}, "objtypes": {"0": "py:class", "1": "py:method", "2": "py:attribute", "3": "py:function"}, "objnames": {"0": ["py", "class", "Python class"], "1": ["py", "method", "Python method"], "2": ["py", "attribute", "Python attribute"], "3": ["py", "function", "Python function"]}, "titleterms": {"tabl": [2, 17, 22], "overview": [2, 17, 22], "protein": [2, 22, 24], "benchmark": [2, 21, 22], "dataset": [2, 21, 22], "amino": 2, "acid": 2, "scale": 2, "data": [3, 4, 24], "load": [3, 24], "api": 4, "featur": [4, 24], "engin": [4, 24], "pu": 4, "learn": 4, "explain": 4, "ai": 4, "perturb": 4, "plot": 4, "util": 4, "aaanalysi": [5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17], "aaclust": 5, "note": [5, 6, 8, 9, 10, 16], "cpp": 6, "cppplot": 7, "exampl": [7, 8, 9, 15, 16, 17], "sequencefeatur": 8, "dpulearn": 9, "load_dataset": 10, "load_scal": 11, "plot_gcf": 12, "plot_get_cdict": 13, "plot_get_cmap": 14, "plot_set_legend": 15, "plot_set": 16, "welcom": 17, "document": [17, 18], "instal": [17, 18], "refer": [17, 21], "indic": 17, "citat": 17, "contribut": 18, "introduct": [18, 20], "vision": 18, "object": 18, "non": 18, "goal": 18, "principl": [18, 23], "bug": 18, "report": 18, "latest": 18, "version": 18, "local": 18, "develop": 18, "environ": 18, "fork": 18, "clone": 18, "depend": 18, "run": 18, "unit": 18, "test": 18, "pull": 18, "request": 18, "preview": 18, "chang": 18, "name": 18, "convent": 18, "class": 18, "templat": 18, "function": 18, "method": 18, "code": 18, "philosophi": 18, "style": 18, "build": 18, "doc": 18, "workflow": 20, "algorithm": 21, "us": 21, "case": 21, "further": 21, "inform": 21, "usag": 23, "tutori": 24, "redund": 24, "reduct": 24, "identif": 24, "neg": 24, "predict": 24}, "envversion": {"sphinx.domains.c": 2, "sphinx.domains.changeset": 1, "sphinx.domains.citation": 1, "sphinx.domains.cpp": 8, "sphinx.domains.index": 1, "sphinx.domains.javascript": 2, "sphinx.domains.math": 2, "sphinx.domains.python": 3, "sphinx.domains.rst": 2, "sphinx.domains.std": 2, "sphinx.ext.viewcode": 1, "sphinx.ext.intersphinx": 1, "sphinx": 57}, "alltitles": {"Tables": [[2, "tables"], [22, "tables"]], "Overview Table": [[2, "overview-table"], [22, "overview-table"]], "Protein benchmark datasets": [[2, "protein-benchmark-datasets"], [22, "protein-benchmark-datasets"]], "Amino acid scale datasets": [[2, "amino-acid-scale-datasets"]], "Data Loading": [[3, "data-loading"]], "API": [[4, "api"]], "Data": [[4, "data"]], "Feature Engineering": [[4, "feature-engineering"]], "PU Learning": [[4, "pu-learning"]], "Explainable AI": [[4, "explainable-ai"]], "Perturbation": [[4, "perturbation"]], "Plot Utilities": [[4, "plot-utilities"]], "aaanalysis.AAclust": [[5, "aaanalysis-aaclust"]], "Notes": [[5, null], [6, null], [6, null], [8, null], [8, null], [8, null], [8, null], [8, null], [9, null], [9, null], [10, null], [16, null]], "aaanalysis.CPP": [[6, "aaanalysis-cpp"]], "aaanalysis.CPPPlot": [[7, "aaanalysis-cppplot"]], "Examples": [[7, null], [8, null], [8, null], [9, null], [15, null], [16, null]], "aaanalysis.SequenceFeature": [[8, "aaanalysis-sequencefeature"]], "aaanalysis.dPULearn": [[9, "aaanalysis-dpulearn"]], "aaanalysis.load_dataset": [[10, "aaanalysis-load-dataset"]], "aaanalysis.load_scales": [[11, "aaanalysis-load-scales"]], "aaanalysis.plot_gcfs": [[12, "aaanalysis-plot-gcfs"]], "aaanalysis.plot_get_cdict": [[13, "aaanalysis-plot-get-cdict"]], "aaanalysis.plot_get_cmap": [[14, "aaanalysis-plot-get-cmap"]], "aaanalysis.plot_set_legend": [[15, "aaanalysis-plot-set-legend"]], "aaanalysis.plot_settings": [[16, "aaanalysis-plot-settings"]], "Welcome to the AAanalysis documentation": [[17, "welcome-to-the-aaanalysis-documentation"]], "Install": [[17, "install"]], "OVERVIEW": [[17, null]], "EXAMPLES": [[17, null]], "REFERENCES": [[17, null]], "Indices and tables": [[17, "indices-and-tables"]], "Citation": [[17, "citation"]], "Contributing": [[18, "contributing"]], "Introduction": [[18, "introduction"], [20, "introduction"]], "Vision": [[18, "vision"]], "Objectives": [[18, "objectives"]], "Non-goals": [[18, "non-goals"]], "Principles": [[18, "principles"]], "Bug Reports": [[18, "bug-reports"]], "Installation": [[18, "installation"]], "Latest Version": [[18, "latest-version"]], "Local Development Environment": [[18, "local-development-environment"]], "Fork and Clone": [[18, "fork-and-clone"]], "Install Dependencies": [[18, "install-dependencies"]], "Run Unit Tests": [[18, "run-unit-tests"]], "Pull Requests": [[18, "pull-requests"]], "Preview Changes": [[18, "preview-changes"]], "Documentation": [[18, "documentation"]], "Naming Conventions": [[18, "naming-conventions"]], "Class Templates": [[18, "class-templates"]], "Function and Method Naming": [[18, "function-and-method-naming"]], "Code Philosophy": [[18, "code-philosophy"]], "Documentation Style": [[18, "documentation-style"]], "Building the Docs": [[18, "building-the-docs"]], "Workflow": [[20, "workflow"]], "References": [[21, "references"]], "Algorithms": [[21, "algorithms"]], "Datasets and Benchmarks": [[21, "datasets-and-benchmarks"]], "Use Cases": [[21, "use-cases"]], "Further Information": [[21, "further-information"]], "Usage Principles": [[23, "usage-principles"]], "Tutorials": [[24, "tutorials"]], "Data loading": [[24, "data-loading"]], "Redundancy-reduction": [[24, "redundancy-reduction"]], "Feature engineering": [[24, "feature-engineering"]], "Identification of negatives": [[24, "identification-of-negatives"]], "Protein prediction": [[24, "protein-prediction"]]}, "indexentries": {"aaclust (class in aaanalysis)": [[5, "aaanalysis.AAclust"]], "__init__() (aaanalysis.aaclust method)": [[5, "aaanalysis.AAclust.__init__"]], "center_labels_ (aaanalysis.aaclust attribute)": [[5, "aaanalysis.AAclust.center_labels_"]], "centers_ (aaanalysis.aaclust attribute)": [[5, "aaanalysis.AAclust.centers_"]], "cluster_naming() (aaanalysis.aaclust method)": [[5, "aaanalysis.AAclust.cluster_naming"]], "correlation() (aaanalysis.aaclust static method)": [[5, "aaanalysis.AAclust.correlation"]], "eval() (aaanalysis.aaclust method)": [[5, "aaanalysis.AAclust.eval"]], "fit() (aaanalysis.aaclust method)": [[5, "aaanalysis.AAclust.fit"]], "get_cluster_centers() (aaanalysis.aaclust static method)": [[5, "aaanalysis.AAclust.get_cluster_centers"]], "get_cluster_medoids() (aaanalysis.aaclust static method)": [[5, "aaanalysis.AAclust.get_cluster_medoids"]], "labels_ (aaanalysis.aaclust attribute)": [[5, "aaanalysis.AAclust.labels_"]], "medoid_ind_ (aaanalysis.aaclust attribute)": [[5, "aaanalysis.AAclust.medoid_ind_"]], "medoid_labels_ (aaanalysis.aaclust attribute)": [[5, "aaanalysis.AAclust.medoid_labels_"]], "medoids_ (aaanalysis.aaclust attribute)": [[5, "aaanalysis.AAclust.medoids_"]], "n_clusters (aaanalysis.aaclust attribute)": [[5, "aaanalysis.AAclust.n_clusters"]], "cpp (class in aaanalysis)": [[6, "aaanalysis.CPP"]], "__init__() (aaanalysis.cpp method)": [[6, "aaanalysis.CPP.__init__"]], "eval() (aaanalysis.cpp static method)": [[6, "aaanalysis.CPP.eval"]], "run() (aaanalysis.cpp method)": [[6, "aaanalysis.CPP.run"]], "cppplot (class in aaanalysis)": [[7, "aaanalysis.CPPPlot"]], "__init__() (aaanalysis.cppplot method)": [[7, "aaanalysis.CPPPlot.__init__"]], "heatmap() (aaanalysis.cppplot method)": [[7, "aaanalysis.CPPPlot.heatmap"]], "profile() (aaanalysis.cppplot method)": [[7, "aaanalysis.CPPPlot.profile"]], "update_seq_size() (aaanalysis.cppplot method)": [[7, "aaanalysis.CPPPlot.update_seq_size"]], "sequencefeature (class in aaanalysis)": [[8, "aaanalysis.SequenceFeature"]], "__init__() (aaanalysis.sequencefeature method)": [[8, "aaanalysis.SequenceFeature.__init__"]], "add_dif() (aaanalysis.sequencefeature static method)": [[8, "aaanalysis.SequenceFeature.add_dif"]], "add_feat_value() (aaanalysis.sequencefeature static method)": [[8, "aaanalysis.SequenceFeature.add_feat_value"]], "add_position() (aaanalysis.sequencefeature static method)": [[8, "aaanalysis.SequenceFeature.add_position"]], "feat_matrix() (aaanalysis.sequencefeature static method)": [[8, "aaanalysis.SequenceFeature.feat_matrix"]], "feat_names() (aaanalysis.sequencefeature static method)": [[8, "aaanalysis.SequenceFeature.feat_names"]], "get_df_parts() (aaanalysis.sequencefeature static method)": [[8, "aaanalysis.SequenceFeature.get_df_parts"]], "get_features() (aaanalysis.sequencefeature method)": [[8, "aaanalysis.SequenceFeature.get_features"]], "get_split_kws() (aaanalysis.sequencefeature static method)": [[8, "aaanalysis.SequenceFeature.get_split_kws"]], "__init__() (aaanalysis.dpulearn method)": [[9, "aaanalysis.dPULearn.__init__"]], "dpulearn (class in aaanalysis)": [[9, "aaanalysis.dPULearn"]], "eval() (aaanalysis.dpulearn method)": [[9, "aaanalysis.dPULearn.eval"]], "fit() (aaanalysis.dpulearn method)": [[9, "aaanalysis.dPULearn.fit"]], "labels_ (aaanalysis.dpulearn attribute)": [[9, "aaanalysis.dPULearn.labels_"]], "load_dataset() (in module aaanalysis)": [[10, "aaanalysis.load_dataset"]], "load_scales() (in module aaanalysis)": [[11, "aaanalysis.load_scales"]], "plot_gcfs() (in module aaanalysis)": [[12, "aaanalysis.plot_gcfs"]], "plot_get_cdict() (in module aaanalysis)": [[13, "aaanalysis.plot_get_cdict"]], "plot_get_cmap() (in module aaanalysis)": [[14, "aaanalysis.plot_get_cmap"]], "plot_set_legend() (in module aaanalysis)": [[15, "aaanalysis.plot_set_legend"]], "plot_settings() (in module aaanalysis)": [[16, "aaanalysis.plot_settings"]]}})
\ No newline at end of file
+Search.setIndex({"docnames": ["_index/badges", "_index/overview", "_index/tables", "_index/usage_principles/data_loading", "api", "generated/aaanalysis.AAclust", "generated/aaanalysis.CPP", "generated/aaanalysis.CPPPlot", "generated/aaanalysis.SequenceFeature", "generated/aaanalysis.dPULearn", "generated/aaanalysis.load_dataset", "generated/aaanalysis.load_scales", "generated/aaanalysis.plot_gcfs", "generated/aaanalysis.plot_get_cdict", "generated/aaanalysis.plot_get_cmap", "generated/aaanalysis.plot_set_legend", "generated/aaanalysis.plot_settings", "index", "index/CONTRIBUTING_COPY", "index/citations", "index/introduction", "index/references", "index/tables_template", "index/usage_principles", "tutorials"], "filenames": ["_index/badges.rst", "_index/overview.rst", "_index/tables.rst", "_index/usage_principles/data_loading.rst", "api.rst", "generated/aaanalysis.AAclust.rst", "generated/aaanalysis.CPP.rst", "generated/aaanalysis.CPPPlot.rst", "generated/aaanalysis.SequenceFeature.rst", "generated/aaanalysis.dPULearn.rst", "generated/aaanalysis.load_dataset.rst", "generated/aaanalysis.load_scales.rst", "generated/aaanalysis.plot_gcfs.rst", "generated/aaanalysis.plot_get_cdict.rst", "generated/aaanalysis.plot_get_cmap.rst", "generated/aaanalysis.plot_set_legend.rst", "generated/aaanalysis.plot_settings.rst", "index.rst", "index/CONTRIBUTING_COPY.rst", "index/citations.rst", "index/introduction.rst", "index/references.rst", "index/tables_template.rst", "index/usage_principles.rst", "tutorials.rst"], "titles": ["&lt;no title&gt;", "&lt;no title&gt;", "Tables", "Data Loading", "API", "aaanalysis.AAclust", "aaanalysis.CPP", "aaanalysis.CPPPlot", "aaanalysis.SequenceFeature", "aaanalysis.dPULearn", "aaanalysis.load_dataset", "aaanalysis.load_scales", "aaanalysis.plot_gcfs", "aaanalysis.plot_get_cdict", "aaanalysis.plot_get_cmap", "aaanalysis.plot_set_legend", "aaanalysis.plot_settings", "Welcome to the AAanalysis documentation", "Contributing", "&lt;no title&gt;", "Introduction", "References", "Tables", "Usage Principles", "Tutorials"], "terms": {"aaanalysi": [1, 4, 18, 19, 20, 22, 23], "amino": [1, 3, 5, 6, 7, 8, 10, 11, 17, 19, 20, 21, 22], "acid": [1, 3, 5, 6, 7, 8, 10, 11, 17, 19, 20, 21, 22], "analysi": [1, 9, 10, 11, 17, 18, 20], "i": [1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 17, 18, 20], "python": [1, 17, 18, 20], "framework": [1, 5, 17, 20], "interpret": [1, 14, 17, 18, 19, 20, 21], "sequenc": [1, 2, 3, 6, 7, 8, 9, 10, 11, 17, 18, 20, 21], "base": [1, 5, 6, 7, 8, 9, 14, 17, 18, 20, 21], "protein": [1, 7, 8, 10, 17, 18, 20, 21], "predict": [1, 2, 3, 17, 18, 20, 21], "provid": [1, 3, 5, 6, 7, 9, 11, 14, 17, 18], "follow": [1, 3, 4, 5, 6, 8, 9, 17, 18, 19, 20], "algorithm": [1, 6, 7, 17, 18, 20], "aaclust": [1, 17, 19, 20, 21, 24], "k": [1, 5, 17, 20, 21], "optim": [1, 5, 6, 7, 17, 20, 21], "cluster": [1, 5, 17, 20, 21], "wrapper": [1, 7, 17, 18, 20], "select": [1, 5, 6, 7, 10, 11, 17, 20, 21], "redund": [1, 5, 6, 17, 20, 21], "reduc": [1, 5, 9, 17, 20, 21], "set": [1, 2, 5, 6, 7, 8, 9, 10, 12, 15, 16, 17, 18, 20, 21], "numer": [1, 5, 7, 8, 17, 20], "scale": [1, 5, 6, 7, 8, 11, 13, 14, 16, 17, 19, 20, 21, 22], "e": [1, 3, 7, 8, 13, 14, 16, 17, 18, 20], "g": [1, 3, 7, 8, 13, 14, 16, 17, 18, 20], "cpp": [1, 7, 8, 14, 17, 19, 20, 24], "compar": [1, 17, 20], "physicochem": [1, 6, 8, 17, 20, 21], "profil": [1, 7, 13, 14, 17, 20], "featur": [1, 5, 6, 7, 8, 9, 14, 17, 18, 20], "engin": [1, 17, 18, 20], "two": [1, 6, 7, 17, 18, 20, 21], "identifi": [1, 6, 7, 9, 17, 20, 21], "most": [1, 5, 6, 7, 9, 17, 20], "distinct": [1, 8, 17, 20], "dpulearn": [1, 17, 19, 20, 24], "determinist": [1, 9, 17, 20], "posit": [1, 2, 3, 5, 6, 7, 8, 9, 14, 17, 20], "unlabel": [1, 3, 9, 17, 20], "pu": [1, 2, 3, 9, 17, 20], "learn": [1, 3, 5, 9, 17, 18, 19, 20, 21], "enabl": [1, 5, 6, 7, 8, 9, 16, 17, 18, 20], "train": [1, 17, 18, 20], "unbalanc": [1, 17, 18, 20], "small": [1, 9, 17, 18, 20], "dataset": [1, 3, 5, 6, 10, 11, 17, 18, 20], "moreov": [1, 17], "function": [1, 4, 7, 12, 14, 16, 17], "load": [1, 10, 11, 17, 18], "benchmark": [1, 3, 10, 17], "load_data": [1, 17], "load_scal": [1, 2, 8, 17, 22], "depth": [1, 17], "level": [1, 2, 7, 10, 17], "classif": [1, 2, 3, 7, 11, 17], "aaontologi": [1, 2, 11, 17, 19, 21], "descript": [2, 18, 22], "see": [2, 3, 7, 10, 18, 22], "also": [2, 3, 9, 18, 22], "1_overview_benchmark": 2, "aa": [2, 3, 4, 6, 8, 9, 10, 15, 16, 22, 23], "load_dataset": [2, 4, 8, 22], "2_overview_scal": 2, "neg": [2, 5, 8, 9, 14], "predictor": 2, "refer": [2, 4, 5, 6, 8], "label": [2, 5, 6, 7, 8, 9, 15, 18], "aa_caspase3": 2, "233": 2, "185605": 2, "705": 2, "184900": 2, "prosper": [2, 21], "caspas": 2, "3": [2, 5, 8, 9, 15, 18], "cleavag": [2, 21], "site": [2, 21], "song18": [2, 21], "1": [2, 3, 5, 6, 7, 8, 9, 15, 16], "adjac": 2, "0": [2, 5, 6, 7, 8, 9, 15, 16], "aa_furin": 2, "71": 2, "59003": 2, "163": 2, "58840": 2, "furin": 2, "aa_ldr": [2, 3], "342": 2, "118248": 2, "35469": 2, "82779": 2, "idp": [2, 21], "seq2seq": [2, 21], "long": 2, "intrins": [2, 21], "disord": [2, 21], "region": [2, 21], "ldr": 2, "tang20": [2, 21], "order": [2, 5, 22], "aa_mmp2": 2, "573": 2, "312976": 2, "2416": 2, "310560": 2, "matrix": [2, 5, 8, 9], "metallopeptidas": 2, "2": [2, 3, 5, 6, 7, 8, 9, 15], "mmp2": 2, "aa_rnabind": 2, "221": 2, "55001": 2, "6492": 2, "48509": 2, "gmksvm": 2, "ru": 2, "rna": [2, 21], "bind": [2, 21], "residu": [2, 3, 11, 21], "rbp60": 2, "yang21": [2, 21], "non": [2, 6, 8, 10], "aa_sa": 2, "101082": 2, "84523": 2, "solvent": 2, "access": [2, 4], "sa": 2, "data": [2, 5, 7, 9, 17, 18], "expos": 2, "buri": 2, "seq_amylo": [2, 3], "1414": 2, "8484": 2, "511": 2, "903": 2, "rerf": [2, 21], "pred": [2, 21], "amyloidognen": 2, "teng21": [2, 21], "amyloidogen": [2, 21], "seq_capsid": 2, "7935": 2, "3364680": 2, "3864": 2, "4071": 2, "viralpro": [2, 21], "capdsid": 2, "galiez16": [2, 21], "capsid": [2, 21], "seq_disulfid": 2, "2547": 2, "614470": 2, "897": 2, "1650": 2, "dipro": 2, "disulfid": 2, "bridg": [2, 21], "cheng06": [2, 21], "ss": 2, "bond": 2, "without": [2, 5, 7, 18], "seq_loc": 2, "1835": 2, "732398": 2, "1045": 2, "790": 2, "nan": 2, "subcellular": [2, 21], "locat": [2, 15], "cytoplasm": 2, "v": 2, "plasma": 2, "membran": [2, 8], "shen19": [2, 21], "seq_solubl": 2, "17408": 2, "4432269": 2, "8704": 2, "solpro": [2, 21], "solubl": [2, 21], "insolubl": 2, "magnan09": [2, 21], "seq_tail": 2, "6668": 2, "2671690": 2, "2574": 2, "4094": 2, "tail": [2, 21], "domain": [2, 3, 8, 10], "dom_gsec": [2, 3], "126": 2, "92964": 2, "63": 2, "gamma": 2, "secretas": [2, 21], "substrat": [2, 21], "breimann23c": [2, 21], "dom_gsec_pu": [2, 3], "694": 2, "494524": 2, "unknown": 2, "statu": 2, "min": 2, "max": 2, "normal": [2, 7, 15], "586": 2, "breimann23b": [2, 17, 19, 21], "scales_raw": [2, 11], "raw": 2, "valu": [2, 5, 6, 7, 8, 18, 20], "kawashima08": [2, 21], "scales_classif": 2, "scales_pc": [2, 11], "princip": [2, 9], "compon": [2, 8, 9], "pc": [2, 9], "compress": 2, "20": [2, 6, 7, 8, 18], "breimann23a": [2, 10, 11, 21], "top60": [2, 11], "top": [2, 5], "60": 2, "subset": [2, 8], "top60_ev": [2, 11], "evalu": [2, 6, 11, 18], "three": [3, 5, 8, 14], "type": [3, 5, 6, 7, 8, 9, 10, 11, 13, 14, 15, 18], "ar": [3, 6, 7, 8, 9, 10, 11, 18, 22], "us": [3, 5, 6, 7, 9, 10, 14, 16, 17, 18, 19, 20], "specif": [3, 5, 13], "properti": [3, 8], "dom": [3, 10], "seq": [3, 10], "The": [3, 5, 6, 7, 8, 9, 10, 11, 13, 14, 15, 18], "each": [3, 5, 6, 7, 8, 9], "indic": [3, 5, 7, 8, 9], "first": [3, 6, 7, 8, 14, 18], "part": [3, 6, 7, 8, 18], "name": [3, 5, 6, 7, 8, 9, 10, 11, 13, 14, 16], "an": [3, 9, 10, 17, 18, 19, 21], "abbrevi": 3, "For": [3, 4, 5, 8, 15, 18], "some": 3, "addit": [3, 7, 8, 9, 15, 16], "version": 3, "contain": [3, 4, 6, 7, 9, 10, 18], "onli": [3, 7, 11, 18], "sampl": [3, 5, 6, 7, 8, 9], "dataset_nam": 3, "_pu": 3, "thi": [4, 5, 7, 16, 18], "page": [4, 17], "public": [4, 17, 18, 19], "object": [4, 5, 7, 8, 9], "more": [4, 7, 18], "exampl": [4, 18], "practic": 4, "usag": [4, 17], "our": [4, 18], "notebook": [4, 24], "conveni": 4, "common": [4, 18], "import": [4, 8, 9, 15, 16, 18, 23], "modul": [4, 5, 17], "Then": 4, "you": [4, 17, 18, 19], "can": [4, 5, 8, 9, 11, 15, 17, 18, 20], "all": [4, 5, 6, 7, 8, 16, 18, 22], "method": [4, 5, 6, 7, 8, 9, 21], "via": [4, 18, 21], "alia": [4, 8], "class": [5, 6, 7, 8, 9, 10], "model": [5, 9, 18], "none": [5, 6, 7, 8, 9, 10, 13, 14, 15], "model_kwarg": 5, "verbos": [5, 6, 7, 8, 9, 16], "fals": [5, 6, 7, 8, 9, 11, 14, 15, 16], "sourc": [5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18], "A": [5, 8, 11, 15, 18, 20, 21], "design": [5, 7, 18], "primarili": [5, 9, 18], "versatil": 5, "enough": 5, "ani": [5, 18, 20], "It": [5, 20], "take": 5, "requir": 5, "pre": [5, 6, 18], "defin": [5, 8, 18], "number": [5, 6, 7, 8, 9, 10, 14, 15], "from": [5, 6, 7, 8, 9, 11, 17, 18, 22], "scikit": [5, 18], "http": [5, 18], "org": [5, 18], "stabl": 5, "html": [5, 18], "By": 5, "leverag": 5, "pearson": [5, 6], "correl": [5, 6], "similar": 5, "measur": [5, 18], "one": [5, 7], "repres": [5, 7, 20], "term": 5, "medoid": 5, "which": [5, 7, 8, 12, 20], "closest": 5, "": [5, 15, 21], "center": [5, 14], "yield": 5, "paramet": [5, 6, 7, 8, 9, 10, 11, 13, 14, 15, 16], "callabl": 5, "option": [5, 6, 7, 8, 9, 10, 11, 14, 16], "default": [5, 6, 7, 8, 9, 10, 11, 13, 14, 15, 16], "sklearn": 5, "kmean": 5, "emploi": [5, 9], "given": [5, 7, 8, 11, 22], "n_cluster": 5, "dict": [5, 6, 7, 8, 9, 13, 14, 15], "dictionari": [5, 6, 7, 8, 13, 14, 15], "keyword": [5, 7, 9], "argument": [5, 7, 8, 9, 15], "pass": [5, 7, 9, 15, 18], "bool": [5, 6, 7, 8, 9, 11, 14, 15, 16], "flag": 5, "disabl": [5, 10], "output": [5, 8, 9, 16], "obtain": [5, 8], "int": [5, 6, 7, 8, 9, 10, 14, 15], "labels_": [5, 9], "arrai": [5, 6, 8, 9], "like": [5, 6, 8, 9, 18], "centers_": 5, "averag": [5, 8], "correspond": [5, 18], "center_labels_": 5, "medoids_": 5, "medoid_labels_": 5, "medoid_ind_": 5, "chosen": [5, 6, 8], "within": [5, 6, 8], "origin": 5, "__init__": [5, 6, 7, 8, 9], "fit": [5, 9, 18], "x": [5, 7, 9, 10, 15, 16], "on_cent": 5, "true": [5, 6, 7, 8, 11, 15, 16], "min_th": 5, "merge_metr": 5, "euclidean": [5, 9], "format": [5, 16], "determin": 5, "partit": 5, "maxim": 5, "beyond": 5, "threshold": [5, 6], "qualiti": 5, "either": [5, 8, 17], "minimum": [5, 8, 10], "member": 5, "min_cor": 5, "between": [5, 6, 7, 8, 14, 15], "its": [5, 18], "govern": 5, "undergo": 5, "stage": 5, "estim": 5, "lower": 5, "bound": 5, "refin": 5, "metric": [5, 9, 18], "merg": 5, "smaller": 5, "direct": 5, "final": 5, "reduct": 5, "shape": [5, 6, 7, 8, 9, 15], "n_sampl": [5, 6, 8, 9], "n_featur": [5, 6, 7, 8, 9], "where": [5, 8, 9], "list": [5, 7, 8, 14, 15], "str": [5, 7, 8, 9, 10, 11, 13, 14, 15, 16], "If": [5, 6, 7, 8, 9, 10, 14, 16, 17, 18, 19], "return": [5, 6, 7, 8, 9, 10, 11, 13, 14, 15], "appli": [5, 9, 14, 15, 16], "otherwis": [5, 7, 8, 9], "float": [5, 6, 7, 9, 14, 15, 16], "instead": 5, "names_medoid": 5, "attribut": 5, "attr": 5, "further": [5, 7, 10, 18], "inform": [5, 6, 7, 8, 9, 10], "paper": 5, "todo": [5, 6, 11], "add": [5, 6, 7, 8], "link": [5, 6, 17, 18, 19, 21], "cluster_nam": 5, "name_unclassifi": 5, "unclassifi": [5, 11], "assign": [5, 7, 8, 9], "frequenc": 5, "renam": 5, "prioriti": 5, "frequent": 5, "alreadi": 5, "doe": 5, "exist": [5, 18], "cannot": 5, "classifi": [5, 7], "static": [5, 6, 8], "get_cluster_cent": 5, "comput": [5, 6, 7, 8, 18, 21], "center_label": 5, "associ": 5, "get_cluster_medoid": 5, "medoid_label": 5, "medoid_ind": 5, "index": [5, 17, 18, 21], "x_test": 5, "x_ref": 5, "labels_test": 5, "labels_ref": 5, "n": [5, 6, 7, 8, 10, 18, 21], "except_unclassifi": 5, "test": [5, 6], "consid": [5, 18], "strength": 5, "els": 5, "exclud": 5, "list_top_center_name_corr": 5, "have": [5, 18], "strongest": 5, "eval": [5, 6, 9, 18], "df_scale": [6, 8], "df_cat": [6, 7, 8], "df_part": [6, 8], "split_kw": [6, 8], "accept_gap": [6, 7, 8], "tool": [6, 18, 21], "creat": [6, 7, 8, 9, 18], "filter": [6, 7, 10], "discrimin": [6, 7], "panda": [6, 7, 8, 9, 11, 18], "datafram": [6, 7, 8, 9, 10, 11, 18], "load_categori": [6, 8], "categori": [6, 7, 8, 11, 13, 14, 15], "sequencefeatur": 6, "get_split_kw": [6, 8], "nest": [6, 8], "split_typ": [6, 8], "whether": [6, 7, 8, 11, 14, 15], "accept": [6, 7, 8], "miss": [6, 7, 8], "omit": [6, 7, 8], "print": [6, 7, 8], "progress": [6, 7, 21], "about": [6, 7], "run": [6, 8], "perform": [6, 9], "step": [6, 7, 8, 20], "parametr": 6, "n_filter": 6, "100": [6, 14], "tmd_len": [6, 7, 8], "jmd_n_len": [6, 7, 8], "10": [6, 7, 8, 14], "jmd_c_len": [6, 7, 8], "ext_len": [6, 7, 8], "4": [6, 7, 8], "start": [6, 7, 8, 18], "check_cat": 6, "n_pre_filt": 6, "pct_pre_filt": 6, "5": [6, 7, 8, 9, 15], "max_std_test": 6, "max_overlap": 6, "max_cor": 6, "n_process": 6, "pipelin": [6, 18], "creation": 6, "aim": [6, 7, 18], "collect": 6, "group": [6, 7, 8], "t": 6, "u": [6, 17, 18], "p": [6, 21], "percentag": [6, 9, 14], "length": [6, 7, 8, 10], "tmd": [6, 7, 8], "explan": [6, 7], "terminu": [6, 7, 8], "jmd": [6, 7, 8], "c": [6, 7, 8, 17, 21], "extend": [6, 7, 8, 18], "termin": [6, 7, 8], "should": [6, 7, 8, 9, 11, 18], "longer": 6, "than": 6, "check": [6, 18], "remain": [6, 18], "after": 6, "maximum": [6, 8, 9, 10], "standard": 6, "deviat": 6, "overlap": 6, "cpu": 6, "multiprocess": 6, "automat": [6, 7, 9, 18], "df_feat": [6, 7, 8], "uniqu": [6, 7], "statist": [6, 7], "n_feature_inform": [6, 7], "eleven": 6, "column": [6, 7, 8, 9, 10, 15, 18], "includ": [6, 8, 11, 14, 15, 18], "id": [6, 8], "result": 6, "rank": 6, "11": [6, 7, 15], "split": [6, 8], "subcategori": [6, 7], "sub": 6, "scale_nam": [6, 7], "abs_auc": [6, 7], "absolut": 6, "adjust": [6, 7, 16], "auc": 6, "abs_mean_dif": 6, "mean": [6, 7], "differ": [6, 7, 8, 15], "std_test": [6, 7], "std_ref": 6, "p_val": 6, "mann_whitnei": 6, "ttest_indep": 6, "p_val_fdr_bh": 6, "benjamini": 6, "hochberg": 6, "fdr": 6, "correct": 6, "get": [6, 8, 12], "condit": [7, 8], "jmd_m_len": [7, 8], "y": [7, 15, 16], "val_col": 7, "mean_dif": 7, "val_typ": 7, "count": [7, 11], "figsiz": 7, "7": [7, 8, 9, 16], "titl": [7, 15], "title_kw": 7, "dict_color": [7, 13, 14, 15], "edge_color": 7, "bar_width": 7, "75": 7, "add_jmd_tmd": 7, "jmd_n_seq": 7, "tmd_seq": 7, "jmd_c_seq": 7, "tmd_color": 7, "mediumspringgreen": 7, "jmd_color": 7, "blue": [7, 15], "tmd_seq_color": 7, "black": [7, 18], "jmd_seq_color": 7, "white": 7, "seq_siz": 7, "tmd_jmd_fontsiz": 7, "xtick_siz": 7, "xtick_width": 7, "xtick_length": 7, "xticks_po": 7, "ytick_siz": 7, "ytick_width": 7, "ytick_length": 7, "ylim": 7, "highlight_tmd_area": 7, "highlight_alpha": 7, "15": [7, 8], "grid": [7, 16], "grid_axi": [7, 16], "both": [7, 16], "add_legend_cat": 7, "legend_kw": 7, "shap_plot": 7, "kwarg": [7, 8, 15], "plot": [7, 13, 14, 15, 16, 17, 18], "instanc": 7, "avail": [7, 17, 19, 21], "specifi": [7, 8, 9, 13, 14, 16, 18], "check_value_typ": 7, "tupl": [7, 14], "size": [7, 8, 12, 14, 15, 16], "custom": [7, 15, 16], "appear": [7, 16], "map": [7, 8, 14, 15], "color": [7, 13, 14, 15], "edg": [7, 15, 18], "bar": [7, 13, 14], "width": [7, 15], "line": [7, 15], "annot": 7, "font": [7, 12, 15, 16], "tick": [7, 16], "axi": [7, 16], "limit": 7, "highlight": 7, "area": 7, "alpha": 7, "ad": 7, "drawn": 7, "legend": [7, 15], "shap": [7, 14, 18], "shaplei": 7, "gener": [7, 8, 14, 16, 18, 20, 21], "other": [7, 11, 18], "intern": 7, "librari": [7, 16, 18], "ax": [7, 15], "matplotlib": [7, 15, 16, 18], "heatmap": [7, 13, 14], "8": [7, 8, 9, 18], "vmin": 7, "vmax": 7, "grid_on": 7, "cmap": [7, 13, 14], "rdbu_r": 7, "cmap_n_color": 7, "cbar_kw": 7, "facecolor_dark": [7, 14], "add_importance_map": 7, "cbar_pct": 7, "featuremap": 7, "versu": 7, "seaborn": [7, 14, 16, 18], "shown": 7, "feat_impact": 7, "displai": 7, "sum": 7, "std": 7, "aggreg": 7, "positions_onli": 7, "across": 7, "recommend": [7, 9, 18], "when": [7, 9], "emphas": [7, 18], "fewer": 7, "value_typ": 7, "height": 7, "figur": 7, "inch": 7, "pyplot": [7, 15], "anchor": [7, 15], "colormap": 7, "infer": [7, 18], "seismic": 7, "space": [7, 9, 14, 15], "impact": 7, "discret": 7, "diverg": 7, "sequenti": 7, "kei": [7, 18], "colorbar": 7, "under": [7, 18], "depicet": 7, "depict": 7, "jmd_n": [7, 8], "jmd_c": [7, 8], "point": [7, 15], "set_xticklabel": 7, "widht": 7, "tick_param": 7, "pcolormesh": 7, "effect": [7, 18], "align": [7, 15], "applic": 7, "document": [7, 22], "detail": [7, 10, 15, 17, 18, 19], "code": [7, 14], "update_seq_s": 7, "retriev": [8, 13, 14], "continu": 8, "transmembran": 8, "principl": [8, 17], "segment": 8, "pattern": 8, "express": 8, "present": 8, "realiz": 8, "over": 8, "valid": [8, 18], "tmd_e": 8, "tmd_n": 8, "tmd_c": 8, "ext_c": 8, "ext_n": 8, "tmd_jmd": 8, "jmd_n_tmd_n": 8, "tmd_c_jmd_c": 8, "ext_n_tmd_n": 8, "tmd_c_ext_c": 8, "get_df_part": 8, "df_seq": [8, 9, 10], "list_part": 8, "all_part": 8, "datafran": 8, "compris": 8, "tmd_start": 8, "tmd_stop": 8, "string": [8, 14], "len": 8, "must": 8, "lenght": 8, "resp": 8, "extra": 8, "possibl": 8, "found": [8, 11, 18], "sf": 8, "gsec_sub_seq": 8, "n_split_min": 8, "n_split_max": 8, "steps_pattern": 8, "n_min": 8, "n_max": 8, "len_max": 8, "steps_periodicpattern": 8, "periodicpattern": 8, "greater": 8, "greatest": 8, "whole": [8, 10], "specfii": 8, "smallest": 8, "integ": 8, "6": 8, "vari": 8, "paramt": 8, "argumetn": 8, "get_featur": 8, "combin": [8, 18], "form": 8, "feat_matrix": 8, "n_job": 8, "return_label": 8, "pd": [8, 9, 10, 18], "seri": 8, "job": 8, "parallel": 8, "spars": 8, "feat_nam": 8, "convert": 8, "depend": 8, "last": 8, "step1": 8, "step2": 8, "add_feat_valu": 8, "dict_scal": 8, "convent": 8, "letter": 8, "feature_valu": 8, "n_part": 8, "ha": [8, 18], "structur": [8, 21], "th": 8, "n_split": 8, "p1": 8, "p2": 8, "pn": 8, "end": 8, "odd": 8, "even": 8, "give": 8, "add_dif": 8, "sample_nam": 8, "ref_group": 8, "add_posit": 8, "part_split": 8, "feat_posit": 8, "total": [8, 9], "n_compon": 9, "pca_kwarg": 9, "offer": [9, 18], "approach": 9, "pca": 9, "dimension": [9, 21], "iter": 9, "reliabl": [9, 18], "These": [9, 18], "those": 9, "distant": 9, "altern": 9, "distanc": 9, "manhattan": 9, "cosin": 9, "80": 9, "cover": 9, "varianc": 9, "identif": [9, 21], "datapoint": 9, "inspir": [9, 18], "techniqu": 9, "theoret": 9, "high": [9, 21], "n_neg": 9, "label_po": 9, "name_neg": 9, "rel_neg": 9, "col_class": 9, "newli": 9, "updat": [9, 18], "new": [9, 18], "store": 9, "Will": 9, "dure": 9, "initi": 9, "datafor": 9, "conta": 9, "po": 9, "unl": 9, "numpi": [9, 18], "np": 9, "atgc": 9, "gcta": 9, "actg": 9, "tacg": 9, "mode": 9, "modifi": [9, 10, 16], "dpul": 9, "info": 10, "non_canonical_aa": 10, "remov": [10, 16], "min_len": 10, "max_len": 10, "categor": 10, "overview": 10, "tabl": 10, "per": 10, "liter": 10, "keep": 10, "gap": [10, 14], "canon": 10, "do": 10, "replac": 10, "symbol": 10, "ref": 10, "just_aaindex": 11, "unclassified_in": 11, "through": 11, "scale_cat": 11, "relev": 11, "scale_classif": 11, "aaindex": [11, 21], "df": 11, "current": 12, "ut": 12, "plot_set": 12, "dict_scale_cat": [13, 14], "cppplot": [13, 14, 18], "respect": [13, 14, 17, 18, 19], "n_color": 14, "color_po": 14, "color_neg": 14, "color_cent": 14, "input": [14, 18], "hex": 14, "pct_gap": 14, "pct_center": 14, "palett": 14, "feat": 14, "ggplot": 14, "datagroup": 14, "dark": 14, "face": 14, "rgb": 14, "hl": 14, "husl": 14, "xkcd": 14, "latter": 14, "rang": 14, "sn": 14, "color_palett": 14, "light_palett": 14, "lighter": 14, "handl": 15, "list_cat": 15, "ncol": 15, "fontsiz": 15, "weight": [15, 21], "lw": 15, "edgecolor": 15, "return_handl": 15, "loc": 15, "upper": 15, "left": 15, "labelspac": 15, "columnspac": 15, "fontsize_legend": 15, "title_align_left": 15, "fontsize_weight": 15, "customiz": 15, "attach": 15, "item": 15, "coordin": 15, "text": [15, 16], "vertic": 15, "horizont": 15, "marker": 15, "directli": [15, 18], "finer": 15, "control": 15, "how": 15, "line2d": 15, "cat1": 15, "red": 15, "cat2": 15, "o": 15, "fig_format": 16, "pdf": 16, "font_scal": 16, "arial": 16, "change_s": 16, "weight_bold": 16, "adjust_el": 16, "short_tick": 16, "no_tick": 16, "no_ticks_i": 16, "short_ticks_i": 16, "no_ticks_x": 16, "short_ticks_x": 16, "configur": 16, "visual": [16, 18], "variou": [16, 18], "file": [16, 18], "save": 16, "make": [16, 18], "visibl": 16, "choos": 16, "san": 16, "serif": 16, "verdana": 16, "helvetica": 16, "dejavu": 16, "element": 16, "bold": 16, "layout": 16, "short": 16, "mark": 16, "global": 16, "pypi": 17, "conda": [17, 18], "forg": 17, "pip": [17, 18], "introduct": 17, "contribut": 17, "tutori": 17, "api": 17, "explain": [17, 18, 21], "ai": [17, 18, 21], "perturb": 17, "util": [17, 18], "search": 17, "your": [17, 18, 19], "work": [17, 19], "pleas": [17, 18, 19], "cite": [17, 19], "_": [17, 19], "breimann": [17, 19, 21], "kamp": [17, 19], "steiner": [17, 19], "frishman": [17, 19], "2023": [17, 19], "ontologi": [17, 19, 21], "machin": [17, 18, 19, 21], "biorxiv": [17, 19, 21], "welcom": 18, "thank": 18, "we": 18, "open": 18, "project": [18, 22], "focus": 18, "involv": 18, "invalu": 18, "made": 18, "wai": 18, "suggest": 18, "github": 18, "issu": 18, "tracker": 18, "submit": 18, "improv": [18, 21], "particip": 18, "discuss": 18, "newcom": 18, "tackl": 18, "good": 18, "email": 18, "stephanbreimann": 18, "gmail": 18, "com": 18, "question": 18, "establish": 18, "comprehens": 18, "toolkit": 18, "robust": 18, "life": 18, "scienc": 18, "integr": [18, 21], "seamlessli": 18, "flexibl": 18, "interoper": 18, "packag": 18, "biopython": 18, "reimplement": 18, "solut": 18, "ignor": 18, "biolog": [18, 20], "context": 18, "relianc": 18, "opaqu": 18, "box": 18, "empir": 18, "insight": 18, "cut": 18, "fair": 18, "account": 18, "transpar": 18, "re": [18, 21], "commit": 18, "divers": 18, "aspect": 18, "causal": 18, "minim": 18, "reproduc": 18, "mre": 18, "least": 18, "amount": 18, "demonstr": 18, "self": 18, "ensur": 18, "necessari": 18, "confirm": 18, "replic": 18, "guidelin": 18, "here": [18, 22], "To": 18, "git": 18, "breimanntool": 18, "master": 18, "repositori": 18, "your_usernam": 18, "navig": 18, "folder": 18, "up": 18, "cd": 18, "isol": 18, "aanalysi": 18, "9": 18, "activ": 18, "poetri": 18, "pytest": 18, "hypothesi": 18, "execut": 18, "case": 18, "directori": 18, "substanti": 18, "minor": 18, "typo": 18, "concis": 18, "clear": 18, "branch": 18, "fix": 18, "readm": 18, "date": 18, "readthedoc": 18, "crucial": 18, "modif": 18, "thei": 18, "render": 18, "correctli": 18, "strive": 18, "consist": [18, 20], "interfac": 18, "well": 18, "organ": 18, "codebas": 18, "standalon": 18, "focu": 18, "special": 18, "task": 18, "carri": 18, "out": 18, "complet": 18, "process": 18, "fulfil": 18, "purpos": 18, "being": 18, "implement": 18, "inherit": 18, "supplementari": 18, "accordingli": 18, "suffix": 18, "support": 18, "semi": 18, "strictli": 18, "adher": 18, "aforement": 18, "primari": 18, "_util": 18, "_utils_const": 18, "py": 18, "modular": 18, "easili": 18, "therefor": 18, "flat": 18, "hierarchi": 18, "program": 18, "outlin": 18, "softwar": 18, "user": 18, "friendli": 18, "hint": 18, "enhanc": 18, "propos": 18, "pep": 18, "484": 18, "book": 18, "error": 18, "messag": 18, "docstr": 18, "257": 18, "guid": 18, "markup": 18, "languag": 18, "restructuredtext": 18, "rst": 18, "primer": 18, "autodoc": 18, "sphinx": 18, "inclus": 18, "napoleon": 18, "extens": 18, "conf": 18, "go": 18, "_build": 18, "browser": 18, "citat": 19, "wa": 20, "develop": 20, "typic": 20, "et": 21, "al": 21, "2023a": 21, "2023b": 21, "2023c": 21, "chart": 21, "\u03b3": 21, "cheng": 21, "2006": 21, "larg": 21, "disulphid": 21, "kernel": 21, "recurs": 21, "neural": 21, "network": 21, "graph": 21, "match": 21, "struct": 21, "funct": 21, "kawashima": 21, "2008": 21, "aid": 21, "databas": 21, "report": 21, "nucleic": 21, "magnan": 21, "randal": 21, "baldi": 21, "2009": 21, "accur": 21, "bioinformat": 21, "galiez": 21, "2016": 21, "viral": 21, "song": 21, "2018": 21, "throughput": 21, "90": 21, "proteas": 21, "accuraci": 21, "shen": 21, "2019": 21, "local": 21, "evolutionari": 21, "chou": 21, "pseaac": 21, "j": 21, "theor": 21, "biol": 21, "tang": 21, "2020": 21, "teng": 21, "2021": 21, "pseudo": 21, "composit": 21, "tripeptid": 21, "bmc": 21, "yang": 21, "granular": 21, "multipl": 21, "appl": 21, "chronolog": 22, "histori": 22, "overview_benchmark": 22, "overview_scal": 22, "view": 24}, "objects": {"aaanalysis": [[5, 0, 1, "", "AAclust"], [6, 0, 1, "", "CPP"], [7, 0, 1, "", "CPPPlot"], [8, 0, 1, "", "SequenceFeature"], [9, 0, 1, "", "dPULearn"], [10, 3, 1, "", "load_dataset"], [11, 3, 1, "", "load_scales"], [12, 3, 1, "", "plot_gcfs"], [13, 3, 1, "", "plot_get_cdict"], [14, 3, 1, "", "plot_get_cmap"], [15, 3, 1, "", "plot_set_legend"], [16, 3, 1, "", "plot_settings"]], "aaanalysis.AAclust": [[5, 1, 1, "", "__init__"], [5, 2, 1, "", "center_labels_"], [5, 2, 1, "", "centers_"], [5, 1, 1, "", "cluster_naming"], [5, 1, 1, "", "correlation"], [5, 1, 1, "", "eval"], [5, 1, 1, "", "fit"], [5, 1, 1, "", "get_cluster_centers"], [5, 1, 1, "", "get_cluster_medoids"], [5, 2, 1, "", "labels_"], [5, 2, 1, "", "medoid_ind_"], [5, 2, 1, "", "medoid_labels_"], [5, 2, 1, "", "medoids_"], [5, 2, 1, "", "n_clusters"]], "aaanalysis.CPP": [[6, 1, 1, "", "__init__"], [6, 1, 1, "", "eval"], [6, 1, 1, "", "run"]], "aaanalysis.CPPPlot": [[7, 1, 1, "", "__init__"], [7, 1, 1, "", "heatmap"], [7, 1, 1, "", "profile"], [7, 1, 1, "", "update_seq_size"]], "aaanalysis.SequenceFeature": [[8, 1, 1, "", "__init__"], [8, 1, 1, "", "add_dif"], [8, 1, 1, "", "add_feat_value"], [8, 1, 1, "", "add_position"], [8, 1, 1, "", "feat_matrix"], [8, 1, 1, "", "feat_names"], [8, 1, 1, "", "get_df_parts"], [8, 1, 1, "", "get_features"], [8, 1, 1, "", "get_split_kws"]], "aaanalysis.dPULearn": [[9, 1, 1, "", "__init__"], [9, 1, 1, "", "eval"], [9, 1, 1, "", "fit"], [9, 2, 1, "", "labels_"]]}, "objtypes": {"0": "py:class", "1": "py:method", "2": "py:attribute", "3": "py:function"}, "objnames": {"0": ["py", "class", "Python class"], "1": ["py", "method", "Python method"], "2": ["py", "attribute", "Python attribute"], "3": ["py", "function", "Python function"]}, "titleterms": {"tabl": [2, 17, 22], "overview": [2, 17, 22], "protein": [2, 22, 24], "benchmark": [2, 21, 22], "dataset": [2, 21, 22], "amino": 2, "acid": 2, "scale": 2, "data": [3, 4, 24], "load": [3, 24], "api": 4, "featur": [4, 24], "engin": [4, 24], "pu": 4, "learn": 4, "explain": 4, "ai": 4, "perturb": 4, "plot": 4, "util": 4, "aaanalysi": [5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17], "aaclust": 5, "note": [5, 6, 8, 9, 10, 16], "cpp": 6, "cppplot": 7, "exampl": [7, 8, 9, 15, 16, 17], "sequencefeatur": 8, "dpulearn": 9, "load_dataset": 10, "load_scal": 11, "plot_gcf": 12, "plot_get_cdict": 13, "plot_get_cmap": 14, "plot_set_legend": 15, "plot_set": 16, "welcom": 17, "document": [17, 18], "instal": [17, 18], "refer": [17, 21], "indic": 17, "citat": 17, "contribut": 18, "introduct": [18, 20], "vision": 18, "object": 18, "non": 18, "goal": 18, "principl": [18, 23], "bug": 18, "report": 18, "latest": 18, "version": 18, "local": 18, "develop": 18, "environ": 18, "fork": 18, "clone": 18, "depend": 18, "run": 18, "unit": 18, "test": 18, "pull": 18, "request": 18, "preview": 18, "chang": 18, "name": 18, "convent": 18, "class": 18, "templat": 18, "function": 18, "method": 18, "code": 18, "philosophi": 18, "style": 18, "build": 18, "doc": 18, "workflow": 20, "algorithm": 21, "us": 21, "case": 21, "further": 21, "inform": 21, "usag": 23, "tutori": 24, "redund": 24, "reduct": 24, "identif": 24, "neg": 24, "predict": 24}, "envversion": {"sphinx.domains.c": 2, "sphinx.domains.changeset": 1, "sphinx.domains.citation": 1, "sphinx.domains.cpp": 8, "sphinx.domains.index": 1, "sphinx.domains.javascript": 2, "sphinx.domains.math": 2, "sphinx.domains.python": 3, "sphinx.domains.rst": 2, "sphinx.domains.std": 2, "sphinx.ext.intersphinx": 1, "sphinx": 57}, "alltitles": {"Tables": [[2, "tables"], [22, "tables"]], "Overview Table": [[2, "overview-table"], [22, "overview-table"]], "Protein benchmark datasets": [[2, "protein-benchmark-datasets"], [22, "protein-benchmark-datasets"]], "Amino acid scale datasets": [[2, "amino-acid-scale-datasets"]], "Data Loading": [[3, "data-loading"]], "API": [[4, "api"]], "Data": [[4, "data"]], "Feature Engineering": [[4, "feature-engineering"]], "PU Learning": [[4, "pu-learning"]], "Explainable AI": [[4, "explainable-ai"]], "Perturbation": [[4, "perturbation"]], "Plot Utilities": [[4, "plot-utilities"]], "aaanalysis.AAclust": [[5, "aaanalysis-aaclust"]], "Notes": [[5, null], [6, null], [6, null], [8, null], [8, null], [8, null], [8, null], [8, null], [9, null], [9, null], [10, null], [16, null]], "aaanalysis.CPP": [[6, "aaanalysis-cpp"]], "aaanalysis.CPPPlot": [[7, "aaanalysis-cppplot"]], "Examples": [[7, null], [8, null], [8, null], [9, null], [15, null], [16, null]], "aaanalysis.SequenceFeature": [[8, "aaanalysis-sequencefeature"]], "aaanalysis.dPULearn": [[9, "aaanalysis-dpulearn"]], "aaanalysis.load_dataset": [[10, "aaanalysis-load-dataset"]], "aaanalysis.load_scales": [[11, "aaanalysis-load-scales"]], "aaanalysis.plot_gcfs": [[12, "aaanalysis-plot-gcfs"]], "aaanalysis.plot_get_cdict": [[13, "aaanalysis-plot-get-cdict"]], "aaanalysis.plot_get_cmap": [[14, "aaanalysis-plot-get-cmap"]], "aaanalysis.plot_set_legend": [[15, "aaanalysis-plot-set-legend"]], "aaanalysis.plot_settings": [[16, "aaanalysis-plot-settings"]], "Welcome to the AAanalysis documentation": [[17, "welcome-to-the-aaanalysis-documentation"]], "Install": [[17, "install"]], "OVERVIEW": [[17, null]], "EXAMPLES": [[17, null]], "REFERENCES": [[17, null]], "Indices and tables": [[17, "indices-and-tables"]], "Citation": [[17, "citation"]], "Contributing": [[18, "contributing"]], "Introduction": [[18, "introduction"], [20, "introduction"]], "Vision": [[18, "vision"]], "Objectives": [[18, "objectives"]], "Non-goals": [[18, "non-goals"]], "Principles": [[18, "principles"]], "Bug Reports": [[18, "bug-reports"]], "Installation": [[18, "installation"]], "Latest Version": [[18, "latest-version"]], "Local Development Environment": [[18, "local-development-environment"]], "Fork and Clone": [[18, "fork-and-clone"]], "Install Dependencies": [[18, "install-dependencies"]], "Run Unit Tests": [[18, "run-unit-tests"]], "Pull Requests": [[18, "pull-requests"]], "Preview Changes": [[18, "preview-changes"]], "Documentation": [[18, "documentation"]], "Naming Conventions": [[18, "naming-conventions"]], "Class Templates": [[18, "class-templates"]], "Function and Method Naming": [[18, "function-and-method-naming"]], "Code Philosophy": [[18, "code-philosophy"]], "Documentation Style": [[18, "documentation-style"]], "Building the Docs": [[18, "building-the-docs"]], "Workflow": [[20, "workflow"]], "References": [[21, "references"]], "Algorithms": [[21, "algorithms"]], "Datasets and Benchmarks": [[21, "datasets-and-benchmarks"]], "Use Cases": [[21, "use-cases"]], "Further Information": [[21, "further-information"]], "Usage Principles": [[23, "usage-principles"]], "Tutorials": [[24, "tutorials"]], "Data loading": [[24, "data-loading"]], "Redundancy-reduction": [[24, "redundancy-reduction"]], "Feature engineering": [[24, "feature-engineering"]], "Identification of negatives": [[24, "identification-of-negatives"]], "Protein prediction": [[24, "protein-prediction"]]}, "indexentries": {"aaclust (class in aaanalysis)": [[5, "aaanalysis.AAclust"]], "__init__() (aaanalysis.aaclust method)": [[5, "aaanalysis.AAclust.__init__"]], "center_labels_ (aaanalysis.aaclust attribute)": [[5, "aaanalysis.AAclust.center_labels_"]], "centers_ (aaanalysis.aaclust attribute)": [[5, "aaanalysis.AAclust.centers_"]], "cluster_naming() (aaanalysis.aaclust method)": [[5, "aaanalysis.AAclust.cluster_naming"]], "correlation() (aaanalysis.aaclust static method)": [[5, "aaanalysis.AAclust.correlation"]], "eval() (aaanalysis.aaclust method)": [[5, "aaanalysis.AAclust.eval"]], "fit() (aaanalysis.aaclust method)": [[5, "aaanalysis.AAclust.fit"]], "get_cluster_centers() (aaanalysis.aaclust static method)": [[5, "aaanalysis.AAclust.get_cluster_centers"]], "get_cluster_medoids() (aaanalysis.aaclust static method)": [[5, "aaanalysis.AAclust.get_cluster_medoids"]], "labels_ (aaanalysis.aaclust attribute)": [[5, "aaanalysis.AAclust.labels_"]], "medoid_ind_ (aaanalysis.aaclust attribute)": [[5, "aaanalysis.AAclust.medoid_ind_"]], "medoid_labels_ (aaanalysis.aaclust attribute)": [[5, "aaanalysis.AAclust.medoid_labels_"]], "medoids_ (aaanalysis.aaclust attribute)": [[5, "aaanalysis.AAclust.medoids_"]], "n_clusters (aaanalysis.aaclust attribute)": [[5, "aaanalysis.AAclust.n_clusters"]], "cpp (class in aaanalysis)": [[6, "aaanalysis.CPP"]], "__init__() (aaanalysis.cpp method)": [[6, "aaanalysis.CPP.__init__"]], "eval() (aaanalysis.cpp static method)": [[6, "aaanalysis.CPP.eval"]], "run() (aaanalysis.cpp method)": [[6, "aaanalysis.CPP.run"]], "cppplot (class in aaanalysis)": [[7, "aaanalysis.CPPPlot"]], "__init__() (aaanalysis.cppplot method)": [[7, "aaanalysis.CPPPlot.__init__"]], "heatmap() (aaanalysis.cppplot method)": [[7, "aaanalysis.CPPPlot.heatmap"]], "profile() (aaanalysis.cppplot method)": [[7, "aaanalysis.CPPPlot.profile"]], "update_seq_size() (aaanalysis.cppplot method)": [[7, "aaanalysis.CPPPlot.update_seq_size"]], "sequencefeature (class in aaanalysis)": [[8, "aaanalysis.SequenceFeature"]], "__init__() (aaanalysis.sequencefeature method)": [[8, "aaanalysis.SequenceFeature.__init__"]], "add_dif() (aaanalysis.sequencefeature static method)": [[8, "aaanalysis.SequenceFeature.add_dif"]], "add_feat_value() (aaanalysis.sequencefeature static method)": [[8, "aaanalysis.SequenceFeature.add_feat_value"]], "add_position() (aaanalysis.sequencefeature static method)": [[8, "aaanalysis.SequenceFeature.add_position"]], "feat_matrix() (aaanalysis.sequencefeature static method)": [[8, "aaanalysis.SequenceFeature.feat_matrix"]], "feat_names() (aaanalysis.sequencefeature static method)": [[8, "aaanalysis.SequenceFeature.feat_names"]], "get_df_parts() (aaanalysis.sequencefeature static method)": [[8, "aaanalysis.SequenceFeature.get_df_parts"]], "get_features() (aaanalysis.sequencefeature method)": [[8, "aaanalysis.SequenceFeature.get_features"]], "get_split_kws() (aaanalysis.sequencefeature static method)": [[8, "aaanalysis.SequenceFeature.get_split_kws"]], "__init__() (aaanalysis.dpulearn method)": [[9, "aaanalysis.dPULearn.__init__"]], "dpulearn (class in aaanalysis)": [[9, "aaanalysis.dPULearn"]], "eval() (aaanalysis.dpulearn method)": [[9, "aaanalysis.dPULearn.eval"]], "fit() (aaanalysis.dpulearn method)": [[9, "aaanalysis.dPULearn.fit"]], "labels_ (aaanalysis.dpulearn attribute)": [[9, "aaanalysis.dPULearn.labels_"]], "load_dataset() (in module aaanalysis)": [[10, "aaanalysis.load_dataset"]], "load_scales() (in module aaanalysis)": [[11, "aaanalysis.load_scales"]], "plot_gcfs() (in module aaanalysis)": [[12, "aaanalysis.plot_gcfs"]], "plot_get_cdict() (in module aaanalysis)": [[13, "aaanalysis.plot_get_cdict"]], "plot_get_cmap() (in module aaanalysis)": [[14, "aaanalysis.plot_get_cmap"]], "plot_set_legend() (in module aaanalysis)": [[15, "aaanalysis.plot_set_legend"]], "plot_settings() (in module aaanalysis)": [[16, "aaanalysis.plot_settings"]]}})
\ No newline at end of file
diff --git a/docs/build/html/tutorials.html b/docs/build/html/tutorials.html
index 795f741e..42faf751 100644
--- a/docs/build/html/tutorials.html
+++ b/docs/build/html/tutorials.html
@@ -104,7 +104,7 @@
       <li><a href="index.html" class="icon icon-home"></a></li>
       <li class="breadcrumb-item active">Tutorials</li>
       <li class="wy-breadcrumbs-aside">
-            <a href="_sources/tutorials.rst.txt" rel="nofollow"> View page source</a>
+              <a href="https://github.com/breimanntools/aaanalysis/blob/master/docs/source/tutorials.rst" class="fa fa-github"> Edit on GitHub</a>
       </li>
   </ul>
   <hr/>
diff --git a/docs/source/_static/css/style.css b/docs/source/_static/css/style.css
index b8bfd848..b6f89b7b 100755
--- a/docs/source/_static/css/style.css
+++ b/docs/source/_static/css/style.css
@@ -32,6 +32,13 @@
    background: #f7f7f7;  /* Sets the background color */
 }
 
+/* Style for inline code */
+.rst-content code {
+    background-color: #f5f5f5;  /* Gray background */
+    font-family: monospace;     /* Monospace font */
+    padding: 2px 2px;           /* Padding around the text */
+}
+
 /* Style for the search input box in the sidebar */
 .wy-side-nav-search input[type=text] {
    border-color: #666666;  /* Sets the border color */
@@ -67,4 +74,4 @@ html.writer-html4 .rst-content dl:not(.docutils)>dt, html.writer-html5 .rst-cont
 /* Style for vertical menu items */
 .wy-menu-vertical a {
    color: #d9d9d9;  /* Sets the text color */
-}
+}
\ No newline at end of file
diff --git a/docs/source/conf.py b/docs/source/conf.py
index 6706575d..13fa651e 100755
--- a/docs/source/conf.py
+++ b/docs/source/conf.py
@@ -43,7 +43,6 @@
     'sphinx.ext.autodoc',  # Autogenerate documentation from docstrings
     #'numpydoc',  # Support for Numpy-style docstrings
     'sphinx.ext.autosummary',  # Generate summary tables for API reference
-    'sphinx.ext.viewcode',  # Link from docs to source code
     'sphinx_rtd_theme',  # Theme emulating "Read the Docs" style # "sphinx_book_theme"
     'sphinx_copybutton',  # Adds a "copy" button to code blocks
     'sphinx.ext.intersphinx',  # Links to documentation of objects in other Sphinx projects
@@ -146,6 +145,15 @@
 html_show_sphinx = False
 html_logo = "_artwork/logo_big_trans.png"
 html_favicon = "_artwork/logo_small.png"
+
+html_context = {
+    'display_github': True,  # Add the 'Edit on GitHub' link
+    'github_user': 'breimanntools',
+    'github_repo': 'aaanalysis',
+    'github_version': 'master/docs/source/',
+}
+
+
 """
 html_favicon = "path_to_your_favicon.ico"
 htmlhelp_basename = "YOUR_PROJECT_NAMEdoc"