From 82573a1fc1e209ff571e2dfb076a1601c5a7d940 Mon Sep 17 00:00:00 2001
From: jianhong <jianhong@users.noreply.github.com>
Date: Tue, 11 Jul 2023 17:26:06 +0000
Subject: [PATCH] =?UTF-8?q?Deploying=20to=20gh-pages=20from=20@=20jianhong?=
 =?UTF-8?q?/genomictools@9f29649471b9df83b293b7736d82429c233e9e0d=20?=
 =?UTF-8?q?=F0=9F=9A=80?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 articles/scripts.html | 249 ++++++++++++++++++++++--------------------
 index.html            |   4 +-
 pkgdown.yml           |   2 +-
 3 files changed, 132 insertions(+), 123 deletions(-)
diff --git a/articles/scripts.html b/articles/scripts.html
index 811796d..268a881 100644
--- a/articles/scripts.html
+++ b/articles/scripts.html
@@ -111,7 +111,8 @@ <h3 id="install-docker">Install docker<a class="anchor" aria-label="anchor" href
 following code in a terminal. This script will get the latest version of
 docker container for this workshop.</p>
 <div class="sourceCode" id="cb1"><pre class="sourceCode bash"><code class="sourceCode bash"><span id="cb1-1"><a href="#cb1-1" tabindex="-1"></a><span class="fu">which</span> docker</span>
-<span id="cb1-2"><a href="#cb1-2" tabindex="-1"></a><span class="ex">docker</span> pull jianhong/genomictools:latest</span></code></pre></div>
+<span id="cb1-2"><a href="#cb1-2" tabindex="-1"></a><span class="co">#docker pull jianhong/genomictools:latest</span></span>
+<span id="cb1-3"><a href="#cb1-3" tabindex="-1"></a><span class="ex">docker</span> pull ghcr.io/jianhong/genomictools:latest</span></code></pre></div>
 <p>Change the docker Memory Resources to &gt;= 5G in the Preferences
 setting page of Docker. And then run the following code in a
 terminal.</p>
@@ -127,34 +128,39 @@ <h3 id="install-docker">Install docker<a class="anchor" aria-label="anchor" href
 rstudio in the container at <a href="http://localhost:8787" class="external-link uri">http://localhost:8787</a> with username “rstudio” and
 password “123456”. All the following steps are running in Rstudio
 “Terminal” or “Console”.</p>
+<p>You may want to open the source of “scripts.Rmd” at the “Source
+Panes” by</p>
+<div class="sourceCode" id="cb3"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="fu">rstudioapi</span><span class="fu">::</span><span class="fu"><a href="https://rstudio.github.io/rstudioapi/reference/rstudio-documents.html" class="external-link">documentOpen</a></span><span class="op">(</span><span class="st">"/usr/local/lib/R/site-library/basicBioinformaticsDRC2023/doc/scripts.Rmd"</span><span class="op">)</span></span></code></pre></div>
 </div>
 </div>
 <div class="section level2">
 <h2 id="run-kallisto-and-salmon-for-rna-seq">Run kallisto and Salmon for RNA-seq<a class="anchor" aria-label="anchor" href="#run-kallisto-and-salmon-for-rna-seq"></a>
 </h2>
-<p>The sample files are packaged in basicBioinformaticsRNI2022 package
+<p>The sample files are packaged in basicBioinformaticsDRC2023 package
 and Docker container.</p>
 <p>Now we will download the zebrafish cDNA files from ENSEMBL in order
 to build the Kallisto and Salmon transcript index. If you are doing rRNA
 depletion library, please download and merge the cDNA and ncDNA files
 from ENSEMBL to make the full transcriptome.</p>
-<div class="sourceCode" id="cb3"><pre class="sourceCode bash"><code class="sourceCode bash"><span id="cb3-1"><a href="#cb3-1" tabindex="-1"></a><span class="bu">cd</span> RNAseq</span>
-<span id="cb3-2"><a href="#cb3-2" tabindex="-1"></a><span class="fu">wget</span> ftp://ftp.ensembl.org/pub/release-105/fasta/danio_rerio/cdna/Danio_rerio.GRCz11.cdna.all.fa.gz</span></code></pre></div>
+<div class="sourceCode" id="cb4"><pre class="sourceCode bash"><code class="sourceCode bash"><span id="cb4-1"><a href="#cb4-1" tabindex="-1"></a><span class="bu">cd</span> RNAseq</span>
+<span id="cb4-2"><a href="#cb4-2" tabindex="-1"></a><span class="fu">wget</span> ftp://ftp.ensembl.org/pub/release-105/fasta/danio_rerio/cdna/Danio_rerio.GRCz11.cdna.all.fa.gz</span></code></pre></div>
 <p>Now we can build the transcriptome index. It will take some time and
 memory for full dataset. This is the reason why we need to set docker
 memory to &gt; 5G.</p>
-<div class="sourceCode" id="cb4"><pre class="sourceCode bash"><code class="sourceCode bash"><span id="cb4-1"><a href="#cb4-1" tabindex="-1"></a><span class="ex">kallisto</span> index <span class="at">-i</span> danRer.GRCz11_transcrits.idx Danio_rerio.GRCz11.cdna.all.fa.gz</span>
-<span id="cb4-2"><a href="#cb4-2" tabindex="-1"></a></span>
-<span id="cb4-3"><a href="#cb4-3" tabindex="-1"></a><span class="ex">salmon</span> index <span class="at">-i</span> danRer.GRCz11_transcrits.salmon.idx <span class="at">-t</span> Danio_rerio.GRCz11.cdna.all.fa.gz</span></code></pre></div>
+<div class="sourceCode" id="cb5"><pre class="sourceCode bash"><code class="sourceCode bash"><span id="cb5-1"><a href="#cb5-1" tabindex="-1"></a><span class="ex">kallisto</span> index <span class="at">-i</span> danRer.GRCz11_transcrits.idx Danio_rerio.GRCz11.cdna.all.fa.gz</span>
+<span id="cb5-2"><a href="#cb5-2" tabindex="-1"></a></span>
+<span id="cb5-3"><a href="#cb5-3" tabindex="-1"></a><span class="ex">salmon</span> index <span class="at">-i</span> danRer.GRCz11_transcrits.salmon.idx <span class="at">-t</span> Danio_rerio.GRCz11.cdna.all.fa.gz</span></code></pre></div>
 <p>The data are only a subset of the whole genome. We will only use
 genes in chromosome 4, 13, 16 and 21 to speed up the test run.</p>
-<div class="sourceCode" id="cb5"><pre class="sourceCode bash"><code class="sourceCode bash"><span id="cb5-1"><a href="#cb5-1" tabindex="-1"></a><span class="fu">mkdir</span> data/RNAseq</span>
-<span id="cb5-2"><a href="#cb5-2" tabindex="-1"></a><span class="bu">cd</span> data/RNAseq</span>
-<span id="cb5-3"><a href="#cb5-3" tabindex="-1"></a><span class="fu">wget</span> https://raw.githubusercontent.com/jianhong/genomictools/master/inst/extdata/Danio_rerio.GRCz11.cdna.toy.fa.gz</span></code></pre></div>
+<div class="sourceCode" id="cb6"><pre class="sourceCode bash"><code class="sourceCode bash"><span id="cb6-1"><a href="#cb6-1" tabindex="-1"></a><span class="fu">mkdir</span> data/RNAseq</span>
+<span id="cb6-2"><a href="#cb6-2" tabindex="-1"></a><span class="bu">cd</span> data/RNAseq</span>
+<span id="cb6-3"><a href="#cb6-3" tabindex="-1"></a><span class="co"># wget https://raw.githubusercontent.com/jianhong/genomictools/master/inst/extdata/Danio_rerio.GRCz11.cdna.toy.fa.gz</span></span>
+<span id="cb6-4"><a href="#cb6-4" tabindex="-1"></a><span class="fu">ln</span> <span class="at">-s</span> /usr/local/lib/R/site-library/basicBioinformaticsDRC2023/extdata/Danio_rerio.GRCz11.cdna.toy.fa.gz ./</span></code></pre></div>
 <p>It will take several seconds to build the toy index.</p>
-<div class="sourceCode" id="cb6"><pre class="sourceCode bash"><code class="sourceCode bash"><span id="cb6-1"><a href="#cb6-1" tabindex="-1"></a><span class="ex">kallisto</span> index <span class="at">-i</span> danRer.GRCz11_transcrits.toy.idx Danio_rerio.GRCz11.cdna.toy.fa.gz</span>
-<span id="cb6-2"><a href="#cb6-2" tabindex="-1"></a></span>
-<span id="cb6-3"><a href="#cb6-3" tabindex="-1"></a><span class="ex">salmon</span> index <span class="at">-i</span> danRer.GRCz11_transcrits.toy.salmon.idx <span class="at">-t</span> Danio_rerio.GRCz11.cdna.toy.fa.gz</span></code></pre></div>
+<div class="sourceCode" id="cb7"><pre class="sourceCode bash"><code class="sourceCode bash"><span id="cb7-1"><a href="#cb7-1" tabindex="-1"></a><span class="ex">kallisto</span> index <span class="at">-i</span> danRer.GRCz11_transcrits.toy.idx Danio_rerio.GRCz11.cdna.toy.fa.gz</span>
+<span id="cb7-2"><a href="#cb7-2" tabindex="-1"></a></span>
+<span id="cb7-3"><a href="#cb7-3" tabindex="-1"></a><span class="ex">salmon</span> index <span class="at">-i</span> danRer.GRCz11_transcrits.toy.salmon.idx <span class="at">-t</span> Danio_rerio.GRCz11.cdna.toy.fa.gz</span></code></pre></div>
 <p>It’s time for quantifying the FASTQ files against our Kallisto index
 and Salmon index. We run both of them for comparison. For real data, you
 can select one of them.</p>
@@ -166,28 +172,28 @@ <h2 id="run-kallisto-and-salmon-for-rna-seq">Run kallisto and Salmon for RNA-seq
 processors in the bootstrapping. We set the bootstrapping by “-b 30” and
 “–numBootstraps 30”.</p>
 <p>It will take several minutes for the sample data.</p>
-<div class="sourceCode" id="cb7"><pre class="sourceCode bash"><code class="sourceCode bash"><span id="cb7-1"><a href="#cb7-1" tabindex="-1"></a><span class="co"># the toy RNAseq data is saved in /home/rstudio/RNAseq folder</span></span>
-<span id="cb7-2"><a href="#cb7-2" tabindex="-1"></a><span class="co"># create a link to current folder</span></span>
-<span id="cb7-3"><a href="#cb7-3" tabindex="-1"></a><span class="fu">ln</span> <span class="at">-s</span> /home/rstudio/RNAseq/fastq ./fastq</span>
-<span id="cb7-4"><a href="#cb7-4" tabindex="-1"></a><span class="co"># mapping</span></span>
-<span id="cb7-5"><a href="#cb7-5" tabindex="-1"></a><span class="co"># Ablated and Uninjured are related with fastq file name</span></span>
-<span id="cb7-6"><a href="#cb7-6" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> kallisto_quant</span>
-<span id="cb7-7"><a href="#cb7-7" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> salmon_quant</span>
-<span id="cb7-8"><a href="#cb7-8" tabindex="-1"></a><span class="cf">for</span> rep <span class="kw">in</span> 1 2</span>
-<span id="cb7-9"><a href="#cb7-9" tabindex="-1"></a><span class="cf">do</span></span>
-<span id="cb7-10"><a href="#cb7-10" tabindex="-1"></a><span class="cf">for</span> cond <span class="kw">in</span> Ablated Uninjured</span>
-<span id="cb7-11"><a href="#cb7-11" tabindex="-1"></a><span class="cf">do</span></span>
-<span id="cb7-12"><a href="#cb7-12" tabindex="-1"></a><span class="ex">kallisto</span> quant <span class="at">-i</span> danRer.GRCz11_transcrits.toy.idx <span class="dt">\</span></span>
-<span id="cb7-13"><a href="#cb7-13" tabindex="-1"></a>               <span class="at">-o</span> kallisto_quant/<span class="va">$cond</span>.rep<span class="va">$rep</span> <span class="dt">\</span></span>
-<span id="cb7-14"><a href="#cb7-14" tabindex="-1"></a>               <span class="at">-b</span> 30 <span class="at">-t</span> 2 fastq/<span class="va">$cond</span>.rep<span class="va">$rep</span>.fastq.gz <span class="dt">\</span></span>
-<span id="cb7-15"><a href="#cb7-15" tabindex="-1"></a>               <span class="at">--single</span> <span class="at">-l</span> 200 <span class="at">-s</span> 50</span>
-<span id="cb7-16"><a href="#cb7-16" tabindex="-1"></a><span class="ex">salmon</span> quant <span class="at">-i</span> danRer.GRCz11_transcrits.toy.salmon.idx <span class="at">-l</span> A <span class="dt">\</span></span>
-<span id="cb7-17"><a href="#cb7-17" tabindex="-1"></a>             <span class="at">-r</span> fastq/<span class="va">$cond</span>.rep<span class="va">$rep</span>.fastq.gz <span class="dt">\</span></span>
-<span id="cb7-18"><a href="#cb7-18" tabindex="-1"></a>             <span class="at">--validateMappings</span> <span class="at">-p</span> 2 <span class="dt">\</span></span>
-<span id="cb7-19"><a href="#cb7-19" tabindex="-1"></a>             <span class="at">-o</span> salmon_quant/<span class="va">$cond</span>.rep<span class="va">$rep</span> <span class="dt">\</span></span>
-<span id="cb7-20"><a href="#cb7-20" tabindex="-1"></a>             <span class="at">--numBootstraps</span> 30 <span class="at">--seqBias</span> <span class="at">--gcBias</span></span>
-<span id="cb7-21"><a href="#cb7-21" tabindex="-1"></a><span class="cf">done</span></span>
-<span id="cb7-22"><a href="#cb7-22" tabindex="-1"></a><span class="cf">done</span></span></code></pre></div>
+<div class="sourceCode" id="cb8"><pre class="sourceCode bash"><code class="sourceCode bash"><span id="cb8-1"><a href="#cb8-1" tabindex="-1"></a><span class="co"># the toy RNAseq data is saved in /home/rstudio/RNAseq folder</span></span>
+<span id="cb8-2"><a href="#cb8-2" tabindex="-1"></a><span class="co"># create a link to current folder</span></span>
+<span id="cb8-3"><a href="#cb8-3" tabindex="-1"></a><span class="fu">ln</span> <span class="at">-s</span> /home/rstudio/RNAseq/fastq ./</span>
+<span id="cb8-4"><a href="#cb8-4" tabindex="-1"></a><span class="co"># mapping</span></span>
+<span id="cb8-5"><a href="#cb8-5" tabindex="-1"></a><span class="co"># Ablated and Uninjured are related with fastq file name</span></span>
+<span id="cb8-6"><a href="#cb8-6" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> kallisto_quant</span>
+<span id="cb8-7"><a href="#cb8-7" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> salmon_quant</span>
+<span id="cb8-8"><a href="#cb8-8" tabindex="-1"></a><span class="cf">for</span> rep <span class="kw">in</span> 1 2</span>
+<span id="cb8-9"><a href="#cb8-9" tabindex="-1"></a><span class="cf">do</span></span>
+<span id="cb8-10"><a href="#cb8-10" tabindex="-1"></a><span class="cf">for</span> cond <span class="kw">in</span> Ablated Uninjured</span>
+<span id="cb8-11"><a href="#cb8-11" tabindex="-1"></a><span class="cf">do</span></span>
+<span id="cb8-12"><a href="#cb8-12" tabindex="-1"></a><span class="ex">kallisto</span> quant <span class="at">-i</span> danRer.GRCz11_transcrits.toy.idx <span class="dt">\</span></span>
+<span id="cb8-13"><a href="#cb8-13" tabindex="-1"></a>               <span class="at">-o</span> kallisto_quant/<span class="va">$cond</span>.rep<span class="va">$rep</span> <span class="dt">\</span></span>
+<span id="cb8-14"><a href="#cb8-14" tabindex="-1"></a>               <span class="at">-b</span> 30 <span class="at">-t</span> 2 fastq/<span class="va">$cond</span>.rep<span class="va">$rep</span>.fastq.gz <span class="dt">\</span></span>
+<span id="cb8-15"><a href="#cb8-15" tabindex="-1"></a>               <span class="at">--single</span> <span class="at">-l</span> 200 <span class="at">-s</span> 50</span>
+<span id="cb8-16"><a href="#cb8-16" tabindex="-1"></a><span class="ex">salmon</span> quant <span class="at">-i</span> danRer.GRCz11_transcrits.toy.salmon.idx <span class="at">-l</span> A <span class="dt">\</span></span>
+<span id="cb8-17"><a href="#cb8-17" tabindex="-1"></a>             <span class="at">-r</span> fastq/<span class="va">$cond</span>.rep<span class="va">$rep</span>.fastq.gz <span class="dt">\</span></span>
+<span id="cb8-18"><a href="#cb8-18" tabindex="-1"></a>             <span class="at">--validateMappings</span> <span class="at">-p</span> 2 <span class="dt">\</span></span>
+<span id="cb8-19"><a href="#cb8-19" tabindex="-1"></a>             <span class="at">-o</span> salmon_quant/<span class="va">$cond</span>.rep<span class="va">$rep</span> <span class="dt">\</span></span>
+<span id="cb8-20"><a href="#cb8-20" tabindex="-1"></a>             <span class="at">--numBootstraps</span> 30 <span class="at">--seqBias</span> <span class="at">--gcBias</span></span>
+<span id="cb8-21"><a href="#cb8-21" tabindex="-1"></a><span class="cf">done</span></span>
+<span id="cb8-22"><a href="#cb8-22" tabindex="-1"></a><span class="cf">done</span></span></code></pre></div>
 </div>
 <div class="section level2">
 <h2 id="r-scripts-for-rnaseq">R scripts for RNAseq<a class="anchor" aria-label="anchor" href="#r-scripts-for-rnaseq"></a>
@@ -200,7 +206,7 @@ <h3 id="prepare-the-transcripts-to-genes-map-table">prepare the transcripts to g
 <p>We are trying to do gene level DE analysis. We need to aggregate the
 transcript level counts to gene level. We borrowed from the Sleuth
 documentation by retrieve ENSEMBL transcript id to gene id.</p>
-<div class="sourceCode" id="cb8"><pre class="downlit sourceCode r">
+<div class="sourceCode" id="cb9"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/r/base/getwd.html" class="external-link">setwd</a></span><span class="op">(</span><span class="st">"data/RNAseq"</span><span class="op">)</span></span>
 <span><span class="kw"><a href="https://rdrr.io/r/base/library.html" class="external-link">library</a></span><span class="op">(</span><span class="va">biomaRt</span><span class="op">)</span></span>
 <span><span class="kw"><a href="https://rdrr.io/r/base/library.html" class="external-link">library</a></span><span class="op">(</span><span class="va"><a href="https://dplyr.tidyverse.org" class="external-link">dplyr</a></span><span class="op">)</span></span>
@@ -219,8 +225,9 @@ <h3 id="prepare-the-transcripts-to-genes-map-table">prepare the transcripts to g
 <span><span class="fu"><a href="https://rdrr.io/r/utils/head.html" class="external-link">head</a></span><span class="op">(</span><span class="va">t2g</span>, n<span class="op">=</span><span class="fl">3</span><span class="op">)</span></span></code></pre></div>
 <p>If you have trouble in downloading the data from ensembl, try to load
 the pre-saved object for the toy data.</p>
-<div class="sourceCode" id="cb9"><pre class="downlit sourceCode r">
-<code class="sourceCode R"><span><span class="va">t2g</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/readRDS.html" class="external-link">readRDS</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/connections.html" class="external-link">url</a></span><span class="op">(</span><span class="st">"https://raw.githubusercontent.com/jianhong/genomictools/master/inst/extdata/t2g.rds"</span><span class="op">)</span><span class="op">)</span></span>
+<div class="sourceCode" id="cb10"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="co"># t2g &lt;- readRDS(url("https://raw.githubusercontent.com/jianhong/genomictools/master/inst/extdata/t2g.rds"))</span></span>
+<span><span class="va">t2g</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/readRDS.html" class="external-link">readRDS</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/system.file.html" class="external-link">system.file</a></span><span class="op">(</span><span class="st">"extdata"</span>, <span class="st">"t2g.rds"</span>, package <span class="op">=</span> <span class="st">"basicBioinformaticsDRC2023"</span><span class="op">)</span><span class="op">)</span></span>
 <span><span class="fu"><a href="https://rdrr.io/r/utils/head.html" class="external-link">head</a></span><span class="op">(</span><span class="va">t2g</span>, n<span class="op">=</span><span class="fl">3</span><span class="op">)</span></span></code></pre></div>
 <p>The following codes are using tximport to import the transcripts
 counts and aggregate to gene level. Downstream are using DESeq2 to do
@@ -229,11 +236,11 @@ <h3 id="prepare-the-transcripts-to-genes-map-table">prepare the transcripts to g
 <div class="section level3">
 <h3 id="run-tximport-deseq2-for-salmon-results">run tximport + DESeq2 for Salmon results<a class="anchor" aria-label="anchor" href="#run-tximport-deseq2-for-salmon-results"></a>
 </h3>
-<div class="sourceCode" id="cb10"><pre class="downlit sourceCode r">
+<div class="sourceCode" id="cb11"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="kw"><a href="https://rdrr.io/r/base/library.html" class="external-link">library</a></span><span class="op">(</span><span class="va">tximport</span><span class="op">)</span></span>
 <span><span class="kw"><a href="https://rdrr.io/r/base/library.html" class="external-link">library</a></span><span class="op">(</span><span class="va">DESeq2</span><span class="op">)</span></span>
 <span></span>
-<span><span class="fu"><a href="https://rdrr.io/r/base/getwd.html" class="external-link">setwd</a></span><span class="op">(</span><span class="st">"RNAseq/"</span><span class="op">)</span> <span class="co">## RNAseq is the folder where saved the salmon_quant and kallisto_quant</span></span>
+<span><span class="fu"><a href="https://rdrr.io/r/base/getwd.html" class="external-link">setwd</a></span><span class="op">(</span><span class="st">"~/data/RNAseq"</span><span class="op">)</span> <span class="co">## RNAseq is the folder where saved the salmon_quant and kallisto_quant</span></span>
 <span><span class="op">(</span><span class="va">salmon_files</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/list.files.html" class="external-link">dir</a></span><span class="op">(</span><span class="st">"salmon_quant"</span>, <span class="st">"sf$"</span>, </span>
 <span>                     recursive <span class="op">=</span> <span class="cn">TRUE</span>, </span>
 <span>                     full.names <span class="op">=</span> <span class="cn">TRUE</span><span class="op">)</span><span class="op">)</span></span>
@@ -252,8 +259,8 @@ <h3 id="run-tximport-deseq2-for-salmon-results">run tximport + DESeq2 for Salmon
 <div class="section level3">
 <h3 id="run-tximport-deseq2-for-kallisto-results">run tximport + DESeq2 for kallisto results<a class="anchor" aria-label="anchor" href="#run-tximport-deseq2-for-kallisto-results"></a>
 </h3>
-<div class="sourceCode" id="cb11"><pre class="downlit sourceCode r">
-<code class="sourceCode R"><span><span class="op">(</span><span class="va">kallisto_files</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/list.files.html" class="external-link">dir</a></span><span class="op">(</span><span class="st">"kallisto_quant"</span>, <span class="st">"abundance.h5"</span>, </span>
+<div class="sourceCode" id="cb12"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="op">(</span><span class="va">kallisto_files</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/list.files.html" class="external-link">dir</a></span><span class="op">(</span><span class="st">"kallisto_quant"</span>, <span class="st">"abundance.tsv"</span>, </span>
 <span>                       recursive <span class="op">=</span> <span class="cn">TRUE</span>, full.names <span class="op">=</span> <span class="cn">TRUE</span><span class="op">)</span><span class="op">)</span></span>
 <span></span>
 <span><span class="va">txi.kallisto</span> <span class="op">&lt;-</span> <span class="fu">tximport</span><span class="op">(</span><span class="va">kallisto_files</span>, type <span class="op">=</span> <span class="st">"kallisto"</span>, </span>
@@ -273,7 +280,7 @@ <h3 id="run-sleuth">run Sleuth<a class="anchor" aria-label="anchor" href="#run-s
 </h3>
 <p>The following code is showing how to use sleuth to do DE analysis.
 However, the sleuth package is not updated. It may be broken.</p>
-<div class="sourceCode" id="cb12"><pre class="downlit sourceCode r">
+<div class="sourceCode" id="cb13"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="co">#BiocManager::install("pachterlab/sleuth")</span></span>
 <span><span class="kw"><a href="https://rdrr.io/r/base/library.html" class="external-link">library</a></span><span class="op">(</span><span class="va">sleuth</span><span class="op">)</span></span>
 <span><span class="va">samples</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/list.files.html" class="external-link">dir</a></span><span class="op">(</span><span class="st">"kallisto_quant"</span><span class="op">)</span></span>
@@ -305,20 +312,21 @@ <h3 id="prepare-index-file-for-bwa">prepare index file for bwa<a class="anchor"
 bwa-mem, there are two steps, build the index and do alignment. BWA
 indexes the genome with an FM index based on the Burrows-Wheeler
 Transform to keep memory requirements low for the alignment process.</p>
-<div class="sourceCode" id="cb13"><pre class="sourceCode bash"><code class="sourceCode bash"><span id="cb13-1"><a href="#cb13-1" tabindex="-1"></a><span class="co">## change you working directory</span></span>
-<span id="cb13-2"><a href="#cb13-2" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> /home/rstudio/data/ChIPseq</span>
-<span id="cb13-3"><a href="#cb13-3" tabindex="-1"></a><span class="fu">ln</span> <span class="at">-s</span> /home/rstudio/ChIPseq/fastq /home/rstudio/data/ChIPseq/</span>
-<span id="cb13-4"><a href="#cb13-4" tabindex="-1"></a><span class="bu">cd</span> /home/rstudio/data/ChIPseq</span>
-<span id="cb13-5"><a href="#cb13-5" tabindex="-1"></a><span class="co">## download the zebrafish GRCz11 genome from ENSEMBLE</span></span>
-<span id="cb13-6"><a href="#cb13-6" tabindex="-1"></a><span class="fu">wget</span> ftp://ftp.ensembl.org/pub/release-105/fasta/danio_rerio/dna/Danio_rerio.GRCz11.dna.primary_assembly.fa.gz</span>
-<span id="cb13-7"><a href="#cb13-7" tabindex="-1"></a><span class="co">## build the index</span></span>
-<span id="cb13-8"><a href="#cb13-8" tabindex="-1"></a><span class="co">## -p: prefix for all index files</span></span>
-<span id="cb13-9"><a href="#cb13-9" tabindex="-1"></a><span class="ex">bwa</span> index <span class="at">-p</span> GRCz11 Danio_rerio.GRCz11.dna.primary_assembly.fa.gz</span></code></pre></div>
+<div class="sourceCode" id="cb14"><pre class="sourceCode bash"><code class="sourceCode bash"><span id="cb14-1"><a href="#cb14-1" tabindex="-1"></a><span class="co">## change you working directory</span></span>
+<span id="cb14-2"><a href="#cb14-2" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> <span class="va">$HOME</span>/data/ChIPseq</span>
+<span id="cb14-3"><a href="#cb14-3" tabindex="-1"></a><span class="fu">ln</span> <span class="at">-s</span> <span class="va">$HOME</span>/ChIPseq/fastq <span class="va">$HOME</span>/data/ChIPseq/</span>
+<span id="cb14-4"><a href="#cb14-4" tabindex="-1"></a><span class="bu">cd</span> <span class="va">$HOME</span>/data/ChIPseq</span>
+<span id="cb14-5"><a href="#cb14-5" tabindex="-1"></a><span class="co">## download the zebrafish GRCz11 genome from ENSEMBLE</span></span>
+<span id="cb14-6"><a href="#cb14-6" tabindex="-1"></a><span class="fu">wget</span> ftp://ftp.ensembl.org/pub/release-105/fasta/danio_rerio/dna/Danio_rerio.GRCz11.dna.primary_assembly.fa.gz</span>
+<span id="cb14-7"><a href="#cb14-7" tabindex="-1"></a><span class="co">## build the index</span></span>
+<span id="cb14-8"><a href="#cb14-8" tabindex="-1"></a><span class="co">## -p: prefix for all index files</span></span>
+<span id="cb14-9"><a href="#cb14-9" tabindex="-1"></a><span class="ex">bwa</span> index <span class="at">-p</span> GRCz11 Danio_rerio.GRCz11.dna.primary_assembly.fa.gz</span></code></pre></div>
 <p>The data are only a subset of the whole genome. We will only use
 genes in chromosome 4, 13, 16 and 21 to speed up the test run.</p>
-<div class="sourceCode" id="cb14"><pre class="sourceCode bash"><code class="sourceCode bash"><span id="cb14-1"><a href="#cb14-1" tabindex="-1"></a><span class="fu">wget</span> https://raw.githubusercontent.com/jianhong/genomictools/master/inst/extdata/Danio_rerio.GRCz11.dna.toy.fa.gz</span>
-<span id="cb14-2"><a href="#cb14-2" tabindex="-1"></a><span class="co">## the following step will take about 3min</span></span>
-<span id="cb14-3"><a href="#cb14-3" tabindex="-1"></a><span class="ex">bwa</span> index <span class="at">-p</span> GRCz11.toy Danio_rerio.GRCz11.dna.toy.fa.gz</span></code></pre></div>
+<div class="sourceCode" id="cb15"><pre class="sourceCode bash"><code class="sourceCode bash"><span id="cb15-1"><a href="#cb15-1" tabindex="-1"></a><span class="co"># wget https://raw.githubusercontent.com/jianhong/genomictools/master/inst/extdata/Danio_rerio.GRCz11.dna.toy.fa.gz</span></span>
+<span id="cb15-2"><a href="#cb15-2" tabindex="-1"></a><span class="fu">ln</span> <span class="at">-s</span> /usr/local/lib/R/site-library/basicBioinformaticsDRC2023/extdata/Danio_rerio.GRCz11.dna.toy.fa.gz ./</span>
+<span id="cb15-3"><a href="#cb15-3" tabindex="-1"></a><span class="co">## the following step will take about 3min</span></span>
+<span id="cb15-4"><a href="#cb15-4" tabindex="-1"></a><span class="ex">bwa</span> index <span class="at">-p</span> GRCz11.toy Danio_rerio.GRCz11.dna.toy.fa.gz</span></code></pre></div>
 </div>
 <div class="section level3">
 <h3 id="run-fastqc-mapping-and-macs2">Run fastQC, mapping and MACS2<a class="anchor" aria-label="anchor" href="#run-fastqc-mapping-and-macs2"></a>
@@ -330,77 +338,78 @@ <h3 id="run-fastqc-mapping-and-macs2">Run fastQC, mapping and MACS2<a class="anc
 We will perform alignment on the single-end reads. For more information
 on BWA and its functionality please refer to the <a href="http://bio-bwa.sourceforge.net/bwa.shtml" class="external-link">user manual</a>. <a href="https://github.com/macs3-project/MACS" class="external-link">MACS2</a> will be used to
 call the peaks.</p>
-<div class="sourceCode" id="cb15"><pre class="sourceCode bash"><code class="sourceCode bash"><span id="cb15-1"><a href="#cb15-1" tabindex="-1"></a><span class="va">group</span><span class="op">=</span><span class="va">(</span>Ablated Ablated Uninjured Uninjured<span class="va">)</span></span>
-<span id="cb15-2"><a href="#cb15-2" tabindex="-1"></a><span class="va">tag</span><span class="op">=</span><span class="va">(</span>Ablated.rep1 Ablated.rep2 Uninjured.rep1 Uninjured.rep2<span class="va">)</span></span>
-<span id="cb15-3"><a href="#cb15-3" tabindex="-1"></a><span class="va">species</span><span class="op">=</span>danRer11</span>
-<span id="cb15-4"><a href="#cb15-4" tabindex="-1"></a><span class="va">prefix</span><span class="op">=</span>bwa</span>
-<span id="cb15-5"><a href="#cb15-5" tabindex="-1"></a></span>
-<span id="cb15-6"><a href="#cb15-6" tabindex="-1"></a><span class="cf">for</span> i <span class="kw">in</span> <span class="dt">{</span><span class="dv">0</span><span class="dt">..</span><span class="dv">3</span><span class="dt">}</span></span>
-<span id="cb15-7"><a href="#cb15-7" tabindex="-1"></a><span class="cf">do</span></span>
-<span id="cb15-8"><a href="#cb15-8" tabindex="-1"></a><span class="co">## fastQC</span></span>
-<span id="cb15-9"><a href="#cb15-9" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> fastqc/<span class="va">${group</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span></span>
-<span id="cb15-10"><a href="#cb15-10" tabindex="-1"></a><span class="ex">fastqc</span> <span class="at">-o</span> fastqc/<span class="va">${group</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span> <span class="at">-t</span> 2 <span class="dt">\</span></span>
-<span id="cb15-11"><a href="#cb15-11" tabindex="-1"></a>       fastq/<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.fastq.gz</span>
-<span id="cb15-12"><a href="#cb15-12" tabindex="-1"></a><span class="co">## trim adapter, need trim_galore be installed, here we do not do this step</span></span>
-<span id="cb15-13"><a href="#cb15-13" tabindex="-1"></a><span class="co"># mkdir -p fastq.trimmed</span></span>
-<span id="cb15-14"><a href="#cb15-14" tabindex="-1"></a><span class="co"># trim_galore -q 15 --fastqc -o fastq.trimmed/${group[$i]} fastq/${tag[$i]}.fastq.gz</span></span>
-<span id="cb15-15"><a href="#cb15-15" tabindex="-1"></a></span>
-<span id="cb15-16"><a href="#cb15-16" tabindex="-1"></a><span class="co">## mapping by bwa</span></span>
-<span id="cb15-17"><a href="#cb15-17" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> sam</span>
-<span id="cb15-18"><a href="#cb15-18" tabindex="-1"></a><span class="co">## -t: number of threads</span></span>
-<span id="cb15-19"><a href="#cb15-19" tabindex="-1"></a><span class="co">## -M: mark shorter split hits as secondary, this is optional for Picard compatibility.</span></span>
-<span id="cb15-20"><a href="#cb15-20" tabindex="-1"></a><span class="co">## &gt;: save alignment to a SAM file</span></span>
-<span id="cb15-21"><a href="#cb15-21" tabindex="-1"></a><span class="co">## 2&gt;: save standard error to log file</span></span>
-<span id="cb15-22"><a href="#cb15-22" tabindex="-1"></a><span class="ex">bwa</span> mem <span class="at">-M</span> <span class="at">-t</span> 2 GRCz11.toy <span class="dt">\</span></span>
-<span id="cb15-23"><a href="#cb15-23" tabindex="-1"></a>           fastq/<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.fastq.gz <span class="dt">\</span></span>
-<span id="cb15-24"><a href="#cb15-24" tabindex="-1"></a>           <span class="op">&gt;</span> sam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.sam <span class="dt">\</span></span>
-<span id="cb15-25"><a href="#cb15-25" tabindex="-1"></a>           <span class="dv">2</span><span class="op">&gt;</span> bwa.<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.log.txt</span>
-<span id="cb15-26"><a href="#cb15-26" tabindex="-1"></a></span>
-<span id="cb15-27"><a href="#cb15-27" tabindex="-1"></a><span class="co">## convert sam file to bam and clean-up</span></span>
-<span id="cb15-28"><a href="#cb15-28" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> bam</span>
-<span id="cb15-29"><a href="#cb15-29" tabindex="-1"></a><span class="co">## -q: skip alignments with MAPQ samller than 30.</span></span>
-<span id="cb15-30"><a href="#cb15-30" tabindex="-1"></a><span class="ex">samtools</span> view <span class="at">-bhS</span> <span class="at">-q</span> 30 sam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.sam <span class="op">&gt;</span> bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.bam</span>
-<span id="cb15-31"><a href="#cb15-31" tabindex="-1"></a><span class="co">## sort and index the bam file for quick access.</span></span>
-<span id="cb15-32"><a href="#cb15-32" tabindex="-1"></a><span class="ex">samtools</span> sort bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.bam <span class="at">-o</span> bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.srt.bam</span>
-<span id="cb15-33"><a href="#cb15-33" tabindex="-1"></a><span class="ex">samtools</span> index bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.srt.bam</span>
-<span id="cb15-34"><a href="#cb15-34" tabindex="-1"></a><span class="co">## remove un-sorted bam file.</span></span>
-<span id="cb15-35"><a href="#cb15-35" tabindex="-1"></a><span class="fu">rm</span> bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.bam</span>
-<span id="cb15-36"><a href="#cb15-36" tabindex="-1"></a></span>
-<span id="cb15-37"><a href="#cb15-37" tabindex="-1"></a><span class="co">## we remove the duplicated by picard::MarkDuplicates. </span></span>
-<span id="cb15-38"><a href="#cb15-38" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> bam/picard</span>
-<span id="cb15-39"><a href="#cb15-39" tabindex="-1"></a><span class="ex">picard</span> MarkDuplicates <span class="dt">\</span></span>
-<span id="cb15-40"><a href="#cb15-40" tabindex="-1"></a>       INPUT=bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.srt.bam <span class="dt">\</span></span>
-<span id="cb15-41"><a href="#cb15-41" tabindex="-1"></a>       OUTPUT=bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.srt.markDup.bam <span class="dt">\</span></span>
-<span id="cb15-42"><a href="#cb15-42" tabindex="-1"></a>       METRICS_FILE=bam/picard/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.srt.fil.picard_info.txt <span class="dt">\</span></span>
-<span id="cb15-43"><a href="#cb15-43" tabindex="-1"></a>       REMOVE_DUPLICATES=true ASSUME_SORTED=true VALIDATION_STRINGENCY=LENIENT</span>
-<span id="cb15-44"><a href="#cb15-44" tabindex="-1"></a><span class="ex">samtools</span> index bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.srt.markDup.bam</span>
-<span id="cb15-45"><a href="#cb15-45" tabindex="-1"></a></span>
-<span id="cb15-46"><a href="#cb15-46" tabindex="-1"></a><span class="co">## use deeptools::bamCoverage to generate bigwig files</span></span>
-<span id="cb15-47"><a href="#cb15-47" tabindex="-1"></a><span class="co">## the bw file can be viewed in IGV</span></span>
-<span id="cb15-48"><a href="#cb15-48" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> bw</span>
-<span id="cb15-49"><a href="#cb15-49" tabindex="-1"></a><span class="ex">bamCoverage</span> <span class="at">-b</span> bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.srt.markDup.bam <span class="at">-o</span> bw/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.bw <span class="at">--normalizeUsing</span> CPM</span>
-<span id="cb15-50"><a href="#cb15-50" tabindex="-1"></a></span>
-<span id="cb15-51"><a href="#cb15-51" tabindex="-1"></a><span class="co">## call peaks by macs2</span></span>
-<span id="cb15-52"><a href="#cb15-52" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> macs3/<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span></span>
-<span id="cb15-53"><a href="#cb15-53" tabindex="-1"></a><span class="co">## -g: mappable genome size</span></span>
-<span id="cb15-54"><a href="#cb15-54" tabindex="-1"></a><span class="co">## -q: use minimum FDR 0.05 cutoff to call significant regions.</span></span>
-<span id="cb15-55"><a href="#cb15-55" tabindex="-1"></a><span class="co">## -B: ask MACS3 to output bedGraph files for experiment.</span></span>
-<span id="cb15-56"><a href="#cb15-56" tabindex="-1"></a><span class="co">## --nomodel --extsize 150: the subset data is not big enough (&lt;1000 peak) for</span></span>
-<span id="cb15-57"><a href="#cb15-57" tabindex="-1"></a><span class="co">## macs3 to generate a model. We manually feed one.</span></span>
-<span id="cb15-58"><a href="#cb15-58" tabindex="-1"></a><span class="co">## because we used toy genome, the genome size we set as 10M</span></span>
-<span id="cb15-59"><a href="#cb15-59" tabindex="-1"></a><span class="ex">macs3</span> callpeak <span class="at">-t</span> bam/<span class="va">${prefix}</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.srt.markDup.bam <span class="dt">\</span></span>
-<span id="cb15-60"><a href="#cb15-60" tabindex="-1"></a>               <span class="at">-f</span> BAM <span class="at">-g</span> 10e6 <span class="at">-n</span> <span class="va">${prefix}</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span> <span class="dt">\</span></span>
-<span id="cb15-61"><a href="#cb15-61" tabindex="-1"></a>               <span class="at">--outdir</span> macs3/<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span> <span class="at">-q</span> 0.05 <span class="dt">\</span></span>
-<span id="cb15-62"><a href="#cb15-62" tabindex="-1"></a>               <span class="at">-B</span> <span class="at">--nomodel</span> <span class="at">--extsize</span> 150</span>
-<span id="cb15-63"><a href="#cb15-63" tabindex="-1"></a></span>
-<span id="cb15-64"><a href="#cb15-64" tabindex="-1"></a><span class="cf">done</span></span></code></pre></div>
+<div class="sourceCode" id="cb16"><pre class="sourceCode bash"><code class="sourceCode bash"><span id="cb16-1"><a href="#cb16-1" tabindex="-1"></a><span class="va">group</span><span class="op">=</span><span class="va">(</span>Ablated Ablated Uninjured Uninjured<span class="va">)</span></span>
+<span id="cb16-2"><a href="#cb16-2" tabindex="-1"></a><span class="va">tag</span><span class="op">=</span><span class="va">(</span>Ablated.rep1 Ablated.rep2 Uninjured.rep1 Uninjured.rep2<span class="va">)</span></span>
+<span id="cb16-3"><a href="#cb16-3" tabindex="-1"></a><span class="va">species</span><span class="op">=</span>danRer11</span>
+<span id="cb16-4"><a href="#cb16-4" tabindex="-1"></a><span class="va">prefix</span><span class="op">=</span>bwa</span>
+<span id="cb16-5"><a href="#cb16-5" tabindex="-1"></a></span>
+<span id="cb16-6"><a href="#cb16-6" tabindex="-1"></a><span class="cf">for</span> i <span class="kw">in</span> <span class="dt">{</span><span class="dv">0</span><span class="dt">..</span><span class="dv">3</span><span class="dt">}</span></span>
+<span id="cb16-7"><a href="#cb16-7" tabindex="-1"></a><span class="cf">do</span></span>
+<span id="cb16-8"><a href="#cb16-8" tabindex="-1"></a><span class="co">## fastQC</span></span>
+<span id="cb16-9"><a href="#cb16-9" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> fastqc/<span class="va">${group</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span></span>
+<span id="cb16-10"><a href="#cb16-10" tabindex="-1"></a><span class="ex">fastqc</span> <span class="at">-o</span> fastqc/<span class="va">${group</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span> <span class="at">-t</span> 2 <span class="dt">\</span></span>
+<span id="cb16-11"><a href="#cb16-11" tabindex="-1"></a>       fastq/<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.fastq.gz</span>
+<span id="cb16-12"><a href="#cb16-12" tabindex="-1"></a><span class="co">## trim adapter, need trim_galore be installed, here we do not do this step</span></span>
+<span id="cb16-13"><a href="#cb16-13" tabindex="-1"></a><span class="co"># mkdir -p fastq.trimmed</span></span>
+<span id="cb16-14"><a href="#cb16-14" tabindex="-1"></a><span class="co"># trim_galore -q 15 --fastqc -o fastq.trimmed/${group[$i]} fastq/${tag[$i]}.fastq.gz</span></span>
+<span id="cb16-15"><a href="#cb16-15" tabindex="-1"></a></span>
+<span id="cb16-16"><a href="#cb16-16" tabindex="-1"></a><span class="co">## mapping by bwa</span></span>
+<span id="cb16-17"><a href="#cb16-17" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> sam</span>
+<span id="cb16-18"><a href="#cb16-18" tabindex="-1"></a><span class="co">## -t: number of threads</span></span>
+<span id="cb16-19"><a href="#cb16-19" tabindex="-1"></a><span class="co">## -M: mark shorter split hits as secondary, this is optional for Picard compatibility.</span></span>
+<span id="cb16-20"><a href="#cb16-20" tabindex="-1"></a><span class="co">## &gt;: save alignment to a SAM file</span></span>
+<span id="cb16-21"><a href="#cb16-21" tabindex="-1"></a><span class="co">## 2&gt;: save standard error to log file</span></span>
+<span id="cb16-22"><a href="#cb16-22" tabindex="-1"></a><span class="ex">bwa</span> mem <span class="at">-M</span> <span class="at">-t</span> 2 GRCz11.toy <span class="dt">\</span></span>
+<span id="cb16-23"><a href="#cb16-23" tabindex="-1"></a>           fastq/<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.fastq.gz <span class="dt">\</span></span>
+<span id="cb16-24"><a href="#cb16-24" tabindex="-1"></a>           <span class="op">&gt;</span> sam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.sam <span class="dt">\</span></span>
+<span id="cb16-25"><a href="#cb16-25" tabindex="-1"></a>           <span class="dv">2</span><span class="op">&gt;</span> bwa.<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.log.txt</span>
+<span id="cb16-26"><a href="#cb16-26" tabindex="-1"></a></span>
+<span id="cb16-27"><a href="#cb16-27" tabindex="-1"></a><span class="co">## convert sam file to bam and clean-up</span></span>
+<span id="cb16-28"><a href="#cb16-28" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> bam</span>
+<span id="cb16-29"><a href="#cb16-29" tabindex="-1"></a><span class="co">## -q: skip alignments with MAPQ samller than 30.</span></span>
+<span id="cb16-30"><a href="#cb16-30" tabindex="-1"></a><span class="ex">samtools</span> view <span class="at">-bhS</span> <span class="at">-q</span> 30 sam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.sam <span class="op">&gt;</span> bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.bam</span>
+<span id="cb16-31"><a href="#cb16-31" tabindex="-1"></a><span class="fu">rm</span> sam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.sam</span>
+<span id="cb16-32"><a href="#cb16-32" tabindex="-1"></a><span class="co">## sort and index the bam file for quick access.</span></span>
+<span id="cb16-33"><a href="#cb16-33" tabindex="-1"></a><span class="ex">samtools</span> sort bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.bam <span class="at">-o</span> bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.srt.bam</span>
+<span id="cb16-34"><a href="#cb16-34" tabindex="-1"></a><span class="ex">samtools</span> index bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.srt.bam</span>
+<span id="cb16-35"><a href="#cb16-35" tabindex="-1"></a><span class="co">## remove un-sorted bam file.</span></span>
+<span id="cb16-36"><a href="#cb16-36" tabindex="-1"></a><span class="fu">rm</span> bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.bam</span>
+<span id="cb16-37"><a href="#cb16-37" tabindex="-1"></a></span>
+<span id="cb16-38"><a href="#cb16-38" tabindex="-1"></a><span class="co">## we remove the duplicated by picard::MarkDuplicates. </span></span>
+<span id="cb16-39"><a href="#cb16-39" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> bam/picard</span>
+<span id="cb16-40"><a href="#cb16-40" tabindex="-1"></a><span class="ex">picard</span> MarkDuplicates <span class="dt">\</span></span>
+<span id="cb16-41"><a href="#cb16-41" tabindex="-1"></a>       INPUT=bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.srt.bam <span class="dt">\</span></span>
+<span id="cb16-42"><a href="#cb16-42" tabindex="-1"></a>       OUTPUT=bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.srt.markDup.bam <span class="dt">\</span></span>
+<span id="cb16-43"><a href="#cb16-43" tabindex="-1"></a>       METRICS_FILE=bam/picard/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.srt.fil.picard_info.txt <span class="dt">\</span></span>
+<span id="cb16-44"><a href="#cb16-44" tabindex="-1"></a>       REMOVE_DUPLICATES=true ASSUME_SORTED=true VALIDATION_STRINGENCY=LENIENT</span>
+<span id="cb16-45"><a href="#cb16-45" tabindex="-1"></a><span class="ex">samtools</span> index bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.srt.markDup.bam</span>
+<span id="cb16-46"><a href="#cb16-46" tabindex="-1"></a></span>
+<span id="cb16-47"><a href="#cb16-47" tabindex="-1"></a><span class="co">## use deeptools::bamCoverage to generate bigwig files</span></span>
+<span id="cb16-48"><a href="#cb16-48" tabindex="-1"></a><span class="co">## the bw file can be viewed in IGV</span></span>
+<span id="cb16-49"><a href="#cb16-49" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> bw</span>
+<span id="cb16-50"><a href="#cb16-50" tabindex="-1"></a><span class="ex">bamCoverage</span> <span class="at">-b</span> bam/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.srt.markDup.bam <span class="at">-o</span> bw/<span class="va">$prefix</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.bw <span class="at">--normalizeUsing</span> CPM</span>
+<span id="cb16-51"><a href="#cb16-51" tabindex="-1"></a></span>
+<span id="cb16-52"><a href="#cb16-52" tabindex="-1"></a><span class="co">## call peaks by macs2</span></span>
+<span id="cb16-53"><a href="#cb16-53" tabindex="-1"></a><span class="fu">mkdir</span> <span class="at">-p</span> macs3/<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span></span>
+<span id="cb16-54"><a href="#cb16-54" tabindex="-1"></a><span class="co">## -g: mappable genome size</span></span>
+<span id="cb16-55"><a href="#cb16-55" tabindex="-1"></a><span class="co">## -q: use minimum FDR 0.05 cutoff to call significant regions.</span></span>
+<span id="cb16-56"><a href="#cb16-56" tabindex="-1"></a><span class="co">## -B: ask MACS3 to output bedGraph files for experiment.</span></span>
+<span id="cb16-57"><a href="#cb16-57" tabindex="-1"></a><span class="co">## --nomodel --extsize 150: the subset data is not big enough (&lt;1000 peak) for</span></span>
+<span id="cb16-58"><a href="#cb16-58" tabindex="-1"></a><span class="co">## macs3 to generate a model. We manually feed one.</span></span>
+<span id="cb16-59"><a href="#cb16-59" tabindex="-1"></a><span class="co">## because we used toy genome, the genome size we set as 10M</span></span>
+<span id="cb16-60"><a href="#cb16-60" tabindex="-1"></a><span class="ex">macs3</span> callpeak <span class="at">-t</span> bam/<span class="va">${prefix}</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span>.srt.markDup.bam <span class="dt">\</span></span>
+<span id="cb16-61"><a href="#cb16-61" tabindex="-1"></a>               <span class="at">-f</span> BAM <span class="at">-g</span> 10e6 <span class="at">-n</span> <span class="va">${prefix}</span>.<span class="va">$species</span>.<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span> <span class="dt">\</span></span>
+<span id="cb16-62"><a href="#cb16-62" tabindex="-1"></a>               <span class="at">--outdir</span> macs3/<span class="va">${tag</span><span class="op">[</span><span class="va">$i</span><span class="op">]</span><span class="va">}</span> <span class="at">-q</span> 0.05 <span class="dt">\</span></span>
+<span id="cb16-63"><a href="#cb16-63" tabindex="-1"></a>               <span class="at">-B</span> <span class="at">--nomodel</span> <span class="at">--extsize</span> 150</span>
+<span id="cb16-64"><a href="#cb16-64" tabindex="-1"></a></span>
+<span id="cb16-65"><a href="#cb16-65" tabindex="-1"></a><span class="cf">done</span></span></code></pre></div>
 </div>
 <div class="section level3">
 <h3 id="differential-analysis">Differential analysis<a class="anchor" aria-label="anchor" href="#differential-analysis"></a>
 </h3>
 <p>We will use <code>DiffBind</code> package to do the differential
 analysis.</p>
-<div class="sourceCode" id="cb16"><pre class="downlit sourceCode r">
+<div class="sourceCode" id="cb17"><pre class="downlit sourceCode r">
 <code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/r/base/getwd.html" class="external-link">setwd</a></span><span class="op">(</span><span class="st">"/home/rstudio/data/ChIPseq"</span><span class="op">)</span></span>
 <span><span class="kw"><a href="https://rdrr.io/r/base/library.html" class="external-link">library</a></span><span class="op">(</span><span class="st">"DiffBind"</span><span class="op">)</span></span>
 <span><span class="op">(</span><span class="va">bams</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/list.files.html" class="external-link">dir</a></span><span class="op">(</span><span class="st">"bam"</span>, <span class="st">"markDup.bam$"</span>, full.names <span class="op">=</span> <span class="cn">TRUE</span><span class="op">)</span><span class="op">)</span></span>
diff --git a/index.html b/index.html
index 1ae12e1..e58fa61 100644
--- a/index.html
+++ b/index.html
@@ -99,10 +99,10 @@ <h2 id="to-use-the-resulting-image">To use the resulting image:<a class="anchor"
 </h2>
 <p>docker file for genomic tools</p>
 <p>Dockerfile to build bwa, kallisto, MACS2, samtools, picard-tools, fastQC, bedtools, cutadapt, deeptools, R, ucsc genome tools images Based on Ubuntu</p>
-<div class="sourceCode" id="cb1"><pre class="sourceCode sh"><code class="sourceCode bash"><span id="cb1-1"><a href="#cb1-1" tabindex="-1"></a><span class="ex">docker</span> run <span class="at">-e</span> PASSWORD=<span class="op">&lt;</span>choose_a_password_for_rstudio<span class="op">&gt;</span> -p 8787:8787 YOURDOCKERIMAGENAME</span></code></pre></div>
+<div class="sourceCode" id="cb1"><pre class="sourceCode sh"><code class="sourceCode bash"><span id="cb1-1"><a href="#cb1-1" tabindex="-1"></a><span class="ex">docker</span> run <span class="at">-e</span> PASSWORD=<span class="op">&lt;</span>choose_a_password_for_rstudio<span class="op">&gt;</span> -p 8787:8787 ghcr.io/jianhong/genomictools:latest</span></code></pre></div>
 <p>Once running, navigate to <a href="http://localhost:8787/" class="external-link uri">http://localhost:8787/</a> and then login with <code>rstudio</code>:<code>yourchosenpassword</code>.</p>
 <p>To try with <strong>this</strong> repository docker image:</p>
-<div class="sourceCode" id="cb2"><pre class="sourceCode sh"><code class="sourceCode bash"><span id="cb2-1"><a href="#cb2-1" tabindex="-1"></a><span class="ex">docker</span> run <span class="at">-e</span> PASSWORD=abc <span class="at">-p</span> 8787:8787 ghcr.io/bioconductor/buildabiocworkshop</span></code></pre></div>
+<div class="sourceCode" id="cb2"><pre class="sourceCode sh"><code class="sourceCode bash"><span id="cb2-1"><a href="#cb2-1" tabindex="-1"></a><span class="ex">docker</span> run <span class="at">-e</span> PASSWORD=123456 <span class="at">-p</span> 8787:8787 ghcr.io/jianhong/genomictools:latest</span></code></pre></div>
 <p><em>NOTE</em>: Running docker that uses the password in plain text like above exposes the password to others in a multi-user system (like a shared workstation or compute node). In practice, consider using an environment variable instead of plain text to pass along passwords and other secrets in docker command lines.</p>
 </div>
 <div class="section level2">
diff --git a/pkgdown.yml b/pkgdown.yml
index ad3a83b..7602f67 100644
--- a/pkgdown.yml
+++ b/pkgdown.yml
@@ -3,7 +3,7 @@ pkgdown: 2.0.7
 pkgdown_sha: ~
 articles:
   scripts: scripts.html
-last_built: 2023-07-11T14:43Z
+last_built: 2023-07-11T17:25Z
 urls:
   reference: https://jianhong.github.io/genoimctools/reference
   article: https://jianhong.github.io/genoimctools/articles