-
Notifications
You must be signed in to change notification settings - Fork 0
/
ldaacp.xml
70 lines (53 loc) · 2.17 KB
/
ldaacp.xml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
<tool id="ldaacp" name="LDA clustering" version="1.0.2">
<requirements>
<container type="docker">galaxyprod_visualisationlda</container>
</requirements>
<description>on a “document × term” datafile</description>
<command><![CDATA[
main $input
#if $clusters
$clusters
#end if
$inputmeta
]]></command>
<inputs>
<param name="input" type="data" format="tabular" label="Fichier source “document × terme”" />
<param name="inputmeta" type="data" format="tabular" label="Fichier des métadonnées “document × terme” au format tsv" />
<param name="clusters" type="integer" value="" min="2" max="200" label="Nombre de clusters" />
</inputs>
<outputs>
<data name="output" format="json" from_work_dir="coordonnees.json" label="topic_coordinates" />
</outputs>
<tests>
<test>
<param name="input" value="ndocDocsMots.txt" />
<param name="clusters" value="10" />
<param name="inputmeta" value="meta.tsv" />
</test>
</tests>
<help><![CDATA[
Ce programme de clusterisation applique l’algorithme **LDA** — et une **ACP** — sur un fichier de données *“document × terme”*.
.. class:: warningmark
Ce fichier de données est formé de 2 colonnes séparées par une tabulation et contenant l’identifiant du document et le terme “indexant” ce document, le tout encodé en UTF-8.
.. class:: warningmark
Il y a autant de lignes que de couples *“document — terme”*.
-----
**Options**
Le programme reçoit plusieurs arguments, soit **obligatoires**, soit *optionnels* :
+ **nom du fichier de données** *“document × terme”*
+ **nombre de clusters souhaités(par défaut : 5)**
-----
**Données d’entrée**
Exemple :
::
GS2_0000067 abrupt transition
GS2_0000067 apparent contrast
GS2_0000067 arc collision
...
GS2_0000067 wide variability
GS2_0000592 anomalous change
GS2_0000592 atomic oxygen
...
-----
]]></help>
</tool>