forked from stefaniegehrke/dhd2016-boa
-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy pathvorträge-042.xml
266 lines (264 loc) · 21.1 KB
/
vorträge-042.xml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
<?xml version="1.0" encoding="UTF-8"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0" xml:id="vorträge-042">
<teiHeader>
<fileDesc>
<titleStmt>
<title>Bearbeitung und Annotation historischer Texte mittels Graph-Datenbanken am Beispiel der Chronik des Matthias von Edessa </title>
<author>
<name>
<surname>Kaufmann</surname>
<forename>Sascha</forename>
</name>
<affiliation>Universität Bern, Schweiz</affiliation>
<email>sascha.kaufmann@dh.unibe.ch</email>
</author>
<author>
<name>
<surname>Andrews</surname>
<forename>Tara Lee</forename>
</name>
<affiliation>Universität Bern, Schweiz</affiliation>
<email>tara.andrews@kps.unibe.ch</email>
</author>
</titleStmt>
<editionStmt>
<edition>
<date>2015-12-29T13:01:00Z</date>
</edition>
</editionStmt>
<publicationStmt>
<publisher>Elisabeth Burr, Universität Leipzig</publisher>
<address>
<addrLine>Beethovenstr. 15</addrLine>
<addrLine>04107 Leipzig</addrLine>
<addrLine>Deutschland</addrLine>
<addrLine>Elisabeth Burr</addrLine>
</address>
</publicationStmt>
<sourceDesc>
<p>Converted from a Word document </p>
</sourceDesc>
</fileDesc>
<encodingDesc>
<appInfo>
<application ident="DHCONVALIDATOR" version="1.17">
<label>DHConvalidator</label>
</application>
</appInfo>
</encodingDesc>
<profileDesc>
<textClass>
<keywords scheme="ConfTool" n="category">
<term>Vortrag</term>
</keywords>
<keywords scheme="ConfTool" n="subcategory">
<term></term>
</keywords>
<keywords scheme="ConfTool" n="keywords">
<term>Graph-Datenbanken</term>
<term>Text-Modellierung</term>
<term>Annotation</term>
<term>Text-Repräsentation</term>
</keywords>
<keywords scheme="ConfTool" n="topics">
<term>Transkription</term>
<term>Strukturanalyse</term>
<term>Annotieren</term>
<term>Bearbeitung</term>
<term>Visualisierung</term>
<term>Manuskript</term>
<term>Text</term>
<term>Werkzeuge</term>
<term>Visualisierung</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<text>
<body>
<p>Die Chronik des Matthias von Edessa ist den meisten Wissenschaftlern des
mittelalterlichen Nahen Ostens und des ersten Kreuzzuges bekannt für ihren Reichtum
an Informationen, sowie der (mutmaßlichen) Ignoranz und Naivität ihres Autors.
Matthias von Edessa war ein Armenischer Priester, der in der Kreuzfahrer-Grafschaft
Edessa lebte und die Chronik zwischen den Jahren 1110 und 1132 verfasste. Gleichwohl
der Text oft von Historikern verwendet wird, liegt er bis heute in keiner kritischen
Edition vor und wurde zuletzt 1898 (Matthias von Edessa 1898) veröffentlicht. Die
Chronik umfasst 35 (kopierte) Manuskripte, deren ältestes auf mindestens 450 Jahre
nach dem Tod des Autors datiert werden kann. Diese werden zur Zeit für eine digitale
Gesamtedition vorbereitet.</p>
<p>Die Herausforderungen, die sich dabei stellen, beschränken sich nicht nur auf die
Bearbeitung aus philologischer Sicht, sondern auch auf die Annotation und
Präsentation als historisches Werk, mit dem Ziel, sie auch als Plattform für
Historiker zur Verfügung zu stellen (z. B. mit Zeit- und Ortsangaben, etc.). Hierzu
greifen wir zum Einen auf eine Reihe aktueller Methoden und Werkzeuge der digitalen
Philologie zurück, wie zum Beispiel die Transkription aller Manuskripte,
palaeographisches Markup unter der Benutzung des TEI-Vokabulars (TEI Consortium
2015), automatische Manuskript-Kollation mit CollateX (Dekker et al. 2014),
stemmatische Analyse mit Hilfe der Werkzeuge von Stemmaweb (Andrews / Macé 2013) und
der Publikation aller Transkriptionen, sowie einer editorischen Rekonstruktion des
Textes. Zum Anderen werden auch Textkommentare von der digitalen Plattform
profitieren, da sie mit weiteren Informationen angereichert werden können. So können
unter Anderem Ortsnamen nicht nur ausgezeichnet („getagged“) werden, sondern ihre
mögliche Lokalisierung auch angegeben und soweit möglich geographisch angezeigt
werden. Personen und ethnographische Bezeichnungen werden nicht nur in einem Index
erfasst, sie werden, soweit möglich, mit prosopographischen Datenbanken oder
relevanten Seiten auf Wikipedia verlinkt.</p>
<p>Das derzeitige Projekt <hi rend="italic">The Chronicle of Matthew of Edessa
Online</hi> wird bis 2018 von dem Schweizer National Fond (SNF) finanziert und
baut auf verschiedenen Projekten und gesammelten Erfahrungen der vergangenen fünf
Jahre auf. </p>
<p>Ziel ist es, dem Forscher oder der Forscherin ein Werkzeug in die Hand zu geben, das
es ihm / ihr erlaubt Bewegungen von Individuen und Gruppen über Raum und Zeit zu
verfolgen, indem wir die Textedition selbst zu einer Plattform für mittelalterliche
Geschichte machen.</p>
<p>Im Folgenden werden wir zwei, aus technischer Sicht wesentliche Aspekte des Projektes vorstellen (Speichern und Wiedergabe von Informationen) und erste Ergebnisse präsentieren.</p>
<div type="div1" rend="DH-Heading">
<head>Effizientes Speichern und Bearbeiten von Manuskripten und Annotationen </head>
<p>Aufbauend auf den Erkenntnissen, die wir aus dem Stemmaweb-Projekt gewonnen haben, werden die Manuskripte in Form von Graphen gespeichert
<ref type="note" target="n01" n="1">1</ref>. Daher ist für uns der naheliegenste Schritt, die gesamte Arbeit des Benutzers im Graph zu repräsentieren. Als mögliche Darstellungsformen für den Benutzer kommen hierfür Online-Präsentationen oder ein Export, zum Beispiel nach TEI, in Betracht.
</p>
<p>Während die Speicherung in Stemmaweb als Perl-Objekte in einer Relationalen-Datenbank
(MySQL (Oracle Cooperation 2015)) erfolgt, haben wir uns für dieses Projekt dafür
entschieden, Neo4J (Neo Technology Inc 2015), eine Graph-Datenbank zu verwenden. Zum
einen kommt dies unserer intern verwendeten Datenstruktur entgegen, die auf einer
Modellierung auf Graphen basiert. Damit verbunden hat dies auch den Vorteil, dass
viele, für uns wichtige Funktionen (z. B. Depth First Search, Breadth First Search,
etc.), nativ vom Datenbanksystem zur Verfügung gestellt werden und speziell
benötigte Operationen, wie z. B. Plausibilitätsprüfungen, einfacher implementiert
und effizienter ausgeführt werden können. </p>
<p>Des Weiteren migrieren wir derzeit große Teile, des aus Stemmaweb vorliegenden
Quellcodes, von Perl nach Java. Gleichzeitig überarbeiten wir die API, mit dem Ziel,
den Service auch über eine Web-API nutzen zu können. Die Hauptgründe hierfür sind,
die bestehende Stemmaweb Backend-Engine zu modernisieren und effizienter zu
gestalten. Dieser Schritt soll bis Ende 2015 abgeschlossen sein.</p>
<p>Parallel zu der Migration, haben wir bereits einen ersten Prototypen des Editions-Interfaces erstellt. Dieser Prototyp basiert bereits auf Neo4J und implementiert ein Textmodel das interoperabel mit Stemmaweb ist und wir zu Testzwecken bereits mit zusätzlichen Annotationen versehen haben.</p>
<p>In Abbildung 1 ist ein typischer Ausschnitt unserer Neo4J Datenbankstruktur zu sehen. Man erkennt, dass sich eine „TRADITION“ aus ein oder mehreren „SECTION“-Knoten zusammensetzt, die wiederum mittels gerichteter „NEXT“-Kanten miteinander verbunden sind und somit ihre Reihenfolge gewährleistet bleibt
<ref type="note" target="n02" n="2">2</ref>. Jeder „SECTION“-Knoten verweist wiederum auf eine Folge von untereinander mit „LEMMA_TEXT“ verbundenen „READING“-Knoten. Darüber hinaus existieren noch sogenannte „TRANSLATION“-Knoten, die die jeweilige Übersetzung in einer Sequenz aus READING-Knoten speichern. Hierbei bleibt es dem Bearbeiter freigestellt, die Granularität der Übersetzung festzulegen. So sind Einheiten, wie zum Beispiel Sigle-Wörter, Sätze oder ganze Paragraphen, etc. vorstellbar.
</p>
<figure>
<graphic n="1001" width="14.316308333333334cm" height="8.607777777777779cm" url="042-image1.png" rend="inline"/>
<head>
<anchor xml:id="Ref306530560"/><hi rend="bold"> </hi><anchor
xml:id="Ref306535271"/><hi rend="bold">Abb. 1</hi> : Beispiel für die
derzeitige Datenbankstruktur in Neo4J. Gut zu Erkennen ist die Gliederung in
Tradition (blau), Sections (orange), Readings (pink) und Translations
(rosa). </head>
</figure></div>
<div type="div1" rend="DH-Heading"><head>Eine adäquate Wiedergabe der gespeicherten Informationen</head>
<p>Wie bereits erwähnt, liegt ein weiterer Schwerpunkt des Projektes auf einer angemessenen Wiedergabe der im System vorhandenen Informationen. Aus diesem Grund haben wir, parallel zu den Arbeiten am Backend, bereits damit begonnen, den Prototypen einer Webseite zur Darstellung der Informationen zu implementieren.</p>
<p>Dieser Prototyp stellt zur Zeit vier Abschnitte (Sections) aus der Chronik bereit,
zwischen denen der Benutzer auswählen kann (Abbildung 2). Zu einem ausgewählten
Abschnitt werden dessen Transkription, sowie (englische) Übersetzung angezeigt. Eine
Karte, in Form einer eingebetteten Google-Map (Google Inc. 2012), zeigt zusätzlich
alle im Abschnitt vorkommenden Örtlichkeiten an, sofern sie lokalisierbar sind. In
der Transkription werden Textteile, zu denen Zusatzinformationen vorliegen, dem
Benutzer farblich kodiert angezeigt (Ortsangaben (blau), Personenangaben (rot) und
Zeitangaben (gelb)).</p>
<figure>
<graphic n="1002" width="16.002cm" height="7.499011111111111cm" url="042-image2.png" rend="inline"/>
<head><anchor xml:id="Ref306530968"/><hi rend="bold">Abb. 2</hi> : Screenshot der
Webseite. Neben der Transkription (linke Spalte), befinden sich die
englische Übersetzung (rechte Spalte), sowie ein Karte mit
Positionsmarkierungen der im Text vorkommenden Ortsbeschreibungen. </head>
</figure>
<p>Fährt nun der Benutzer mit dem Mauszeiger über einen solchen farblich hervorgehobenen Textteil, werden zu diesem in einem Popup-Fenster weitere Informationen oder Verlinkungen angezeigt. So ist zum Beispiel für Ortsangaben, wie in Abbildung 3 zu sehen, dies üblicherweise der Ortsname, sowie ein vergrößerter Ausschnitt der Karte mit einer Markierung der genauen Position, soweit diese bekannt ist. </p>
<figure>
<graphic n="1003" width="8.711847222222222cm" height="6.2424027777777775cm" url="042-image3.png" rend="inline"/>
<head><hi rend="bold">Abb. 3</hi>: Beispiel für Zusatzinformationen bezüglich
Constantinople (Faith).</head>
</figure>
<p>Bei Personenangaben, siehe Abbildung 4, wird die Übersetzung des Namens, der volle
Name und weitere Informationen, sowie Links, die zu Einträgen bezüglich der Person
auf externen Seiten verweisen, hier Links zu <hi rend="italic">Wikipedia</hi>
(Wikimedia Foundation 2015) und <hi rend="italic">Prosopography of the Byzantine
World</hi> (Jeffreys et al. 2011), in einem Popup-Fenster angezeigt. <lb/>
</p>
<figure>
<graphic n="1004" width="16.002cm" height="7.499011111111111cm" url="042-image4.png" rend="inline"/>
<head> </head>
<head><hi rend="bold">Abb. 4</hi> : Beispiel für Zusatzinformationen bezüglich
Ioannes 1 (John I Tzimiskes).</head>
</figure>
<p>Darüber hinaus arbeiten wir daran, sowohl individuelle Textzeugen als auch verschiedene Variationen eines Textes anzeigen zu können.</p>
<p>Hervorzuheben ist, wie oben bereits angedeutet, das die Plattform auch die
Möglichkeit bietet, die Edition zu exportieren. Hierzu werden relevante Standards
wie zum Beispiel TEI oder CIDOC-CRM (International Council of Museums 2014)
angeboten. </p></div>
<div type="div1" rend="DH-Heading"><head>Zusammenfassung und Ausblick</head>
<p>Wir haben einen kurzen Einblick in das Projekt The Chronicle
of Matthew of Edessa Online gegeben. Dieses hat als Ziel eine digitale
Plattform zur Verfügung zu stellen, welche das Untersuchen und Bearbeiten von
Manuskripten aus philologischer, als auch historischer Sichtweise unterstützt.
Hierzu haben wir einen Einblick in technische Aspekte und dem derzeitigen Stand der
Implementierung gegeben. Zusammendfassend kann man sagen, dass wir schon eine gute
Strecke zurückgelegt haben und dass das Projekt noch einige interessante Aufgaben
für uns bereit hält <ref type="note" target="n03" n="3">3</ref>.</p></div>
</body>
<back>
<div type="Notes">
<note xml:id="n01" n="1">Stemmaweb bietet seinen Benutzern die Möglichkeit mit Text-Kollationen und Varianten zur stemmatischen Analyse zu arbeiten und diese zu modifizieren. Des Weiteren können Texte basierend auf Kollationen und Stemmata rekonstruiert und erstellt werden. Hierfür hat es sich bewährt, Texte in einem Graph abzubilden.</note>
<note xml:id="n02" n="2">Dieser Ansatz wurde gewählt, da eine automatische Kollation für längere Texte am besten mit einer Einteilung in diskrete Abschnitte (Sections) gelingt. Desweiteren können wir somit Textzeugen, deren Abschnitte abweichend angeordnet sind, ohne Schwierigkeiten darstellen</note>
<note xml:id="n03" n="3">Interessante Aufgaben wären zum Beispiel die Gestaltung der Web-Oberfläche, die Interaktion mit dem Benutzer, Optimierung der Graph-Datenbank, Web-API oder die Bereitstellung verschiedener Exportformate, um nur einige zu nennen.</note>
</div>
<div type="bibliogr">
<listBibl>
<head>Bibliographie</head>
<bibl>
<hi rend="bold">Andrews, Tara L. / Macé, Caroline </hi>(2013): „Beyond the
tree of texts: Building an empirical model of scribal variation through
graph analysis of texts and stemmata“, in: <hi rend="italic">Literary and
Linguistic Computing </hi>28, 4: 504-21 <ref
target="http://dx.doi.org/10.1093/llc/fqu072"
>http://dx.doi.org/10.1093/llc/fqu072</ref> [letzter Zugriff 09. Februar
2016]. </bibl>
<bibl>
<hi rend="bold">Dekker, Ronald Haentjens / Hulle, Dirk van / Middell, Gregor
/ Neyt, Vincent / Zundert, Joris van</hi> (2014): „Computer-supported
collation of modern manuscripts: CollateX and the Beckett Digital Manuscript
Project“, in <hi rend="italic">Literary and Linguistic Computing</hi> 25:
1-19 <ref target="http://dx.doi.org/10.1093/llc/fqu007"
>http://dx.doi.org/10.1093/llc/fqu007</ref> [letzter Zugriff 09. Februar
2016]. </bibl>
<bibl>
<hi rend="bold">Google Inc</hi> (2012): <hi rend="italic">Google Maps </hi>
<ref target="http://www.google.com/maps">http://www.google.com/maps</ref>
[letzter Zugriff 15. Oktober 2015]. </bibl>
<bibl>
<hi rend="bold">International Council of Museums</hi> (2014): <hi
rend="italic">The CIDOC Conceptual Reference Model</hi>
<ref target="http://www.cidoc-crm.org">http://www.cidoc-crm.org</ref>
[letzter Zugriff 15. Oktober 2015]. </bibl>
<bibl>
<hi rend="bold">Jeffreys, Michael</hi> (2011): <hi rend="italic"
>Prosopography of the Byzantine World</hi>
<ref target="http://www.pbw.kcl.ac.uk">www.pbw.kcl.ac.uk</ref> [letzter
Zugriff 15. Oktober 2015]. </bibl>
<bibl>
<hi rend="bold">Matthias von Edessa (Mattʿēos Uṙhayecʿi)</hi> (1898): <hi
rend="italic">Die Croniken des Matthias von Edessa
Žamanakagrutʿiwn</hi>. Vałaršapat. </bibl>
<bibl>
<hi rend="bold">Neo Technology Inc</hi>. (2015): <hi rend="italic"
>Neo4j</hi>
<ref target="http://www.neo4j.com">http://www.neo4j.com</ref> [letzter
Zugriff 15. Oktober 2015]. </bibl>
<bibl>
<hi rend="bold">Oracle Cooperation</hi> (2015): <hi rend="italic">MySQL </hi>
<ref target="https://www.mysql.com">https://www.mysql.com</ref> [letzter
Zugriff 15. Oktober 2015]. </bibl>
<bibl>
<hi rend="bold">TEI Consortium</hi> (2015): <hi rend="italic">Guidelines for
Electronic Text Encoding and Interchange. Version 2.8.0 </hi>
<ref target="http://www.tei-c.org/Vault/P5/2.8.0/doc/tei-p5-doc/en/html/"
>http://www.tei-c.org/Vault/P5/2.8.0/doc/tei-p5-doc/en/html/</ref>
[letzter Zugriff 15. Oktober 2015]. </bibl>
<bibl>
<hi rend="bold">Wikimedia Foundation</hi> (2015): <hi rend="italic"
>Wikipedia</hi>
<ref target="http://www.wikipedia.org">http://www.wikipedia.org</ref>
[letzter Zugriff 15. Oktober 2015]. </bibl>
</listBibl>
</div>
</back>
</text>
</TEI>