input/xml/vorträge-042.xml

<?xml version="1.0" encoding="UTF-8"?>
<TEI xmlns="http://www.tei-c.org/ns/1.0" xml:id="vorträge-042">
  <teiHeader>
    <fileDesc>
      <titleStmt>
        <title>Bearbeitung und Annotation historischer Texte mittels Graph-Datenbanken am Beispiel der Chronik des Matthias von Edessa </title>
        <author>
          <name>
            <surname>Kaufmann</surname>
            <forename>Sascha</forename>
          </name>
          <affiliation>Universität Bern, Schweiz</affiliation>
          <email>sascha.kaufmann@dh.unibe.ch</email>
        </author>
        <author>
          <name>
            <surname>Andrews</surname>
            <forename>Tara Lee</forename>
          </name>
          <affiliation>Universität Bern, Schweiz</affiliation>
          <email>tara.andrews@kps.unibe.ch</email>
        </author>
      </titleStmt>
      <editionStmt>
        <edition>
          <date>2015-12-29T13:01:00Z</date>
        </edition>
      </editionStmt>
      <publicationStmt>
        <publisher>Elisabeth Burr, Universität Leipzig</publisher>
        <address>
          <addrLine>Beethovenstr. 15</addrLine>
          <addrLine>04107 Leipzig</addrLine>
          <addrLine>Deutschland</addrLine>
          <addrLine>Elisabeth Burr</addrLine>
        </address>
      </publicationStmt>
      <sourceDesc>
        <p>Converted from a Word document </p>
      </sourceDesc>
    </fileDesc>
    <encodingDesc>
      <appInfo>
        <application ident="DHCONVALIDATOR" version="1.17">
          <label>DHConvalidator</label>
        </application>
      </appInfo>
    </encodingDesc>
    <profileDesc>
      <textClass>
        <keywords scheme="ConfTool" n="category">
          <term>Vortrag</term>
        </keywords>
        <keywords scheme="ConfTool" n="subcategory">
          <term></term>
        </keywords>
        <keywords scheme="ConfTool" n="keywords">
          <term>Graph-Datenbanken</term>
          <term>Text-Modellierung</term>
          <term>Annotation</term>
          <term>Text-Repräsentation</term>
        </keywords>
        <keywords scheme="ConfTool" n="topics">
          <term>Transkription</term>
          <term>Strukturanalyse</term>
          <term>Annotieren</term>
          <term>Bearbeitung</term>
          <term>Visualisierung</term>
          <term>Manuskript</term>
          <term>Text</term>
          <term>Werkzeuge</term>
          <term>Visualisierung</term>
        </keywords>
      </textClass>
    </profileDesc>
  </teiHeader>
  <text>
    <body>
      <p>Die Chronik des Matthias von Edessa ist den meisten Wissenschaftlern des
        mittelalterlichen Nahen Ostens und des ersten Kreuzzuges bekannt für ihren Reichtum
        an Informationen, sowie der (mutmaßlichen) Ignoranz und Naivität ihres Autors.
        Matthias von Edessa war ein Armenischer Priester, der in der Kreuzfahrer-Grafschaft
        Edessa lebte und die Chronik zwischen den Jahren 1110 und 1132 verfasste. Gleichwohl
        der Text oft von Historikern verwendet wird, liegt er bis heute in keiner kritischen
        Edition vor und wurde zuletzt 1898 (Matthias von Edessa 1898) veröffentlicht. Die
        Chronik umfasst 35 (kopierte) Manuskripte, deren ältestes auf mindestens 450 Jahre
        nach dem Tod des Autors datiert werden kann. Diese werden zur Zeit für eine digitale
        Gesamtedition vorbereitet.</p>
        <p>Die Herausforderungen, die sich dabei stellen, beschränken sich nicht nur auf die
          Bearbeitung aus philologischer Sicht, sondern auch auf die Annotation und
          Präsentation als historisches Werk, mit dem Ziel, sie auch als Plattform für
          Historiker zur Verfügung zu stellen (z. B. mit Zeit- und Ortsangaben, etc.). Hierzu
          greifen wir zum Einen auf eine Reihe aktueller Methoden und Werkzeuge der digitalen
          Philologie zurück, wie zum Beispiel die Transkription aller Manuskripte,
          palaeographisches Markup unter der Benutzung des TEI-Vokabulars (TEI Consortium
          2015), automatische Manuskript-Kollation mit CollateX (Dekker et al. 2014),
          stemmatische Analyse mit Hilfe der Werkzeuge von Stemmaweb (Andrews / Macé 2013) und
          der Publikation aller Transkriptionen, sowie einer editorischen Rekonstruktion des
          Textes. Zum Anderen werden auch Textkommentare von der digitalen Plattform
          profitieren, da sie mit weiteren Informationen angereichert werden können. So können
          unter Anderem Ortsnamen nicht nur ausgezeichnet („getagged“) werden, sondern ihre
          mögliche Lokalisierung auch angegeben und soweit möglich geographisch angezeigt
          werden. Personen und ethnographische Bezeichnungen werden nicht nur in einem Index
          erfasst, sie werden, soweit möglich, mit prosopographischen Datenbanken oder
          relevanten Seiten auf Wikipedia verlinkt.</p>
          <p>Das derzeitige Projekt <hi rend="italic">The Chronicle of Matthew of Edessa
            Online</hi> wird bis 2018 von dem Schweizer National Fond (SNF) finanziert und
            baut auf verschiedenen Projekten und gesammelten Erfahrungen der vergangenen fünf
            Jahre auf. </p>
            <p>Ziel ist es, dem Forscher oder der Forscherin ein Werkzeug in die Hand zu geben, das
              es ihm / ihr erlaubt Bewegungen von Individuen und Gruppen über Raum und Zeit zu
              verfolgen, indem wir die Textedition selbst zu einer Plattform für mittelalterliche
              Geschichte machen.</p>
              <p>Im Folgenden werden wir zwei, aus technischer Sicht wesentliche Aspekte des Projektes vorstellen (Speichern und Wiedergabe von Informationen) und erste Ergebnisse präsentieren.</p>
              <div type="div1" rend="DH-Heading">
                <head>Effizientes Speichern und Bearbeiten von Manuskripten und Annotationen </head>
                <p>Aufbauend auf den Erkenntnissen, die wir aus dem Stemmaweb-Projekt gewonnen haben, werden die Manuskripte in Form von Graphen gespeichert
                  <ref type="note" target="n01" n="1">1</ref>. Daher ist für uns der naheliegenste Schritt, die gesamte Arbeit des Benutzers im Graph zu repräsentieren. Als mögliche Darstellungsformen für den Benutzer kommen hierfür Online-Präsentationen oder ein Export, zum Beispiel nach TEI, in Betracht.
                </p>
                <p>Während die Speicherung in Stemmaweb als Perl-Objekte in einer Relationalen-Datenbank
                  (MySQL (Oracle Cooperation 2015)) erfolgt, haben wir uns für dieses Projekt dafür
                  entschieden, Neo4J (Neo Technology Inc 2015), eine Graph-Datenbank zu verwenden. Zum
                  einen kommt dies unserer intern verwendeten Datenstruktur entgegen, die auf einer
                  Modellierung auf Graphen basiert. Damit verbunden hat dies auch den Vorteil, dass
                  viele, für uns wichtige Funktionen (z. B. Depth First Search, Breadth First Search,
                  etc.), nativ vom Datenbanksystem zur Verfügung gestellt werden und speziell
                  benötigte Operationen, wie z. B. Plausibilitätsprüfungen, einfacher implementiert
                  und effizienter ausgeführt werden können. </p>
                  <p>Des Weiteren migrieren wir derzeit große Teile, des aus Stemmaweb vorliegenden
                    Quellcodes, von Perl nach Java. Gleichzeitig überarbeiten wir die API, mit dem Ziel,
                    den Service auch über eine Web-API nutzen zu können. Die Hauptgründe hierfür sind,
                    die bestehende Stemmaweb Backend-Engine zu modernisieren und effizienter zu
                    gestalten. Dieser Schritt soll bis Ende 2015 abgeschlossen sein.</p>
                    <p>Parallel zu der Migration, haben wir bereits einen ersten Prototypen des Editions-Interfaces erstellt. Dieser Prototyp basiert bereits auf Neo4J und implementiert ein Textmodel das interoperabel mit Stemmaweb ist und wir zu Testzwecken bereits mit zusätzlichen Annotationen versehen haben.</p>
                    <p>In Abbildung 1 ist ein typischer Ausschnitt unserer Neo4J Datenbankstruktur zu sehen. Man erkennt, dass sich eine „TRADITION“ aus ein oder mehreren „SECTION“-Knoten zusammensetzt, die wiederum mittels gerichteter „NEXT“-Kanten miteinander verbunden sind und somit ihre Reihenfolge gewährleistet bleibt
                      <ref type="note" target="n02" n="2">2</ref>. Jeder „SECTION“-Knoten verweist wiederum auf eine Folge von untereinander mit „LEMMA_TEXT“ verbundenen „READING“-Knoten. Darüber hinaus existieren noch sogenannte „TRANSLATION“-Knoten, die die jeweilige Übersetzung in einer Sequenz aus READING-Knoten speichern. Hierbei bleibt es dem Bearbeiter freigestellt, die Granularität der Übersetzung festzulegen. So sind Einheiten, wie zum Beispiel Sigle-Wörter, Sätze oder ganze Paragraphen, etc. vorstellbar.
                    </p>
                    <figure>
                      <graphic n="1001" width="14.316308333333334cm" height="8.607777777777779cm" url="042-image1.png" rend="inline"/>
                      <head>
                        <anchor xml:id="Ref306530560"/><hi rend="bold"> </hi><anchor
                        xml:id="Ref306535271"/><hi rend="bold">Abb. 1</hi> : Beispiel für die
                        derzeitige Datenbankstruktur in Neo4J. Gut zu Erkennen ist die Gliederung in
                        Tradition (blau), Sections (orange), Readings (pink) und Translations
                        (rosa). </head>
                      </figure></div>
                      <div type="div1" rend="DH-Heading"><head>Eine adäquate Wiedergabe der gespeicherten Informationen</head>
                      <p>Wie bereits erwähnt, liegt ein weiterer Schwerpunkt des Projektes auf einer angemessenen Wiedergabe der im System vorhandenen Informationen. Aus diesem Grund haben wir, parallel zu den Arbeiten am Backend, bereits damit begonnen, den Prototypen einer Webseite zur Darstellung der Informationen zu implementieren.</p>
                      <p>Dieser Prototyp stellt zur Zeit vier Abschnitte (Sections) aus der Chronik bereit,
                        zwischen denen der Benutzer auswählen kann (Abbildung 2). Zu einem ausgewählten
                        Abschnitt werden dessen Transkription, sowie (englische) Übersetzung angezeigt. Eine
                        Karte, in Form einer eingebetteten Google-Map (Google Inc. 2012), zeigt zusätzlich
                        alle im Abschnitt vorkommenden Örtlichkeiten an, sofern sie lokalisierbar sind. In
                        der Transkription werden Textteile, zu denen Zusatzinformationen vorliegen, dem
                        Benutzer farblich kodiert angezeigt (Ortsangaben (blau), Personenangaben (rot) und
                        Zeitangaben (gelb)).</p>
                        <figure>
                          <graphic n="1002" width="16.002cm" height="7.499011111111111cm" url="042-image2.png" rend="inline"/>
                          <head><anchor xml:id="Ref306530968"/><hi rend="bold">Abb. 2</hi> : Screenshot der
                          Webseite. Neben der Transkription (linke Spalte), befinden sich die
                          englische Übersetzung (rechte Spalte), sowie ein Karte mit
                          Positionsmarkierungen der im Text vorkommenden Ortsbeschreibungen. </head>
                        </figure>
                        <p>Fährt nun der Benutzer mit dem Mauszeiger über einen solchen farblich hervorgehobenen Textteil, werden zu diesem in einem Popup-Fenster weitere Informationen oder Verlinkungen angezeigt. So ist zum Beispiel für Ortsangaben, wie in Abbildung 3 zu sehen, dies üblicherweise der Ortsname, sowie ein vergrößerter Ausschnitt der Karte mit einer Markierung der genauen Position, soweit diese bekannt ist. </p>
                        <figure>
                          <graphic n="1003" width="8.711847222222222cm" height="6.2424027777777775cm" url="042-image3.png" rend="inline"/>
                          <head><hi rend="bold">Abb. 3</hi>: Beispiel für Zusatzinformationen bezüglich
                          Constantinople (Faith).</head>
                        </figure>
                        <p>Bei Personenangaben, siehe Abbildung 4, wird die Übersetzung des Namens, der volle
                          Name und weitere Informationen, sowie Links, die zu Einträgen bezüglich der Person
                          auf externen Seiten verweisen, hier Links zu <hi rend="italic">Wikipedia</hi>
                          (Wikimedia Foundation 2015) und <hi rend="italic">Prosopography of the Byzantine
                          World</hi> (Jeffreys et al. 2011), in einem Popup-Fenster angezeigt. <lb/>
                        </p>
                        <figure>
                          <graphic n="1004" width="16.002cm" height="7.499011111111111cm" url="042-image4.png" rend="inline"/>
                          <head> </head>

                          <head><hi rend="bold">Abb. 4</hi> : Beispiel für Zusatzinformationen bezüglich
                          Ioannes 1 (John I Tzimiskes).</head>

                        </figure>
                        <p>Darüber hinaus arbeiten wir daran, sowohl individuelle Textzeugen als auch verschiedene Variationen eines Textes anzeigen zu können.</p>
                        <p>Hervorzuheben ist, wie oben bereits angedeutet, das die Plattform auch die
                          Möglichkeit bietet, die Edition zu exportieren. Hierzu werden relevante Standards
                          wie zum Beispiel TEI oder CIDOC-CRM (International Council of Museums 2014)
                          angeboten. </p></div>
                          <div type="div1" rend="DH-Heading"><head>Zusammenfassung und Ausblick</head>
                          <p>Wir haben einen kurzen Einblick in das Projekt The Chronicle
                            of Matthew of Edessa Online gegeben. Dieses hat als Ziel eine digitale
                            Plattform zur Verfügung zu stellen, welche das Untersuchen und Bearbeiten von
                            Manuskripten aus philologischer, als auch historischer Sichtweise unterstützt.
                            Hierzu haben wir einen Einblick in technische Aspekte und dem derzeitigen Stand der
                            Implementierung gegeben. Zusammendfassend kann man sagen, dass wir schon eine gute
                            Strecke zurückgelegt haben und dass das Projekt noch einige interessante Aufgaben
                            für uns bereit hält <ref type="note" target="n03" n="3">3</ref>.</p></div>
                          </body>
                          <back>
                            <div type="Notes">
                              <note xml:id="n01" n="1">Stemmaweb bietet seinen Benutzern die Möglichkeit mit Text-Kollationen und Varianten zur stemmatischen Analyse zu arbeiten und diese zu modifizieren. Des Weiteren können Texte basierend auf Kollationen und Stemmata rekonstruiert und erstellt werden. Hierfür hat es sich bewährt, Texte in einem Graph abzubilden.</note>
                              <note xml:id="n02" n="2">Dieser Ansatz wurde gewählt, da eine automatische Kollation für längere Texte am besten mit einer Einteilung in diskrete Abschnitte (Sections) gelingt. Desweiteren können wir somit Textzeugen, deren Abschnitte abweichend angeordnet sind, ohne Schwierigkeiten darstellen</note>
                              <note xml:id="n03" n="3">Interessante Aufgaben wären zum Beispiel die Gestaltung der Web-Oberfläche, die Interaktion mit dem Benutzer, Optimierung der Graph-Datenbank, Web-API oder die Bereitstellung verschiedener Exportformate, um nur einige zu nennen.</note>
                            </div>
                            <div type="bibliogr">
                              <listBibl>
                                <head>Bibliographie</head>
                                <bibl>
                                  <hi rend="bold">Andrews, Tara L. / Macé, Caroline </hi>(2013): „Beyond the
                                  tree of texts: Building an empirical model of scribal variation through
                                  graph analysis of texts and stemmata“, in: <hi rend="italic">Literary and
                                  Linguistic Computing </hi>28, 4: 504-21 <ref
                                  target="http://dx.doi.org/10.1093/llc/fqu072"
                                  >http://dx.doi.org/10.1093/llc/fqu072</ref> [letzter Zugriff 09. Februar
                                  2016]. </bibl>
                                  <bibl>
                                    <hi rend="bold">Dekker, Ronald Haentjens / Hulle, Dirk van / Middell, Gregor
                                      / Neyt, Vincent / Zundert, Joris van</hi> (2014): „Computer-supported
                                      collation of modern manuscripts: CollateX and the Beckett Digital Manuscript
                                      Project“, in <hi rend="italic">Literary and Linguistic Computing</hi> 25:
                                      1-19 <ref target="http://dx.doi.org/10.1093/llc/fqu007"
                                      >http://dx.doi.org/10.1093/llc/fqu007</ref> [letzter Zugriff 09. Februar
                                      2016]. </bibl>
                                      <bibl>
                                        <hi rend="bold">Google Inc</hi> (2012): <hi rend="italic">Google Maps </hi>
                                        <ref target="http://www.google.com/maps">http://www.google.com/maps</ref>
                                        [letzter Zugriff 15. Oktober 2015]. </bibl>
                                        <bibl>
                                          <hi rend="bold">International Council of Museums</hi> (2014): <hi
                                          rend="italic">The CIDOC Conceptual Reference Model</hi>
                                          <ref target="http://www.cidoc-crm.org">http://www.cidoc-crm.org</ref>
                                          [letzter Zugriff 15. Oktober 2015]. </bibl>
                                          <bibl>
                                            <hi rend="bold">Jeffreys, Michael</hi> (2011): <hi rend="italic"
                                            >Prosopography of the Byzantine World</hi>
                                            <ref target="http://www.pbw.kcl.ac.uk">www.pbw.kcl.ac.uk</ref> [letzter
                                            Zugriff 15. Oktober 2015]. </bibl>
                                            <bibl>
                                              <hi rend="bold">Matthias von Edessa (Mattʿēos Uṙhayecʿi)</hi> (1898): <hi
                                              rend="italic">Die Croniken des Matthias von Edessa
                                              Žamanakagrutʿiwn</hi>. Vałaršapat. </bibl>
                                              <bibl>
                                                <hi rend="bold">Neo Technology Inc</hi>. (2015): <hi rend="italic"
                                                >Neo4j</hi>
                                                <ref target="http://www.neo4j.com">http://www.neo4j.com</ref> [letzter
                                                Zugriff 15. Oktober 2015]. </bibl>
                                                <bibl>
                                                  <hi rend="bold">Oracle Cooperation</hi> (2015): <hi rend="italic">MySQL </hi>
                                                  <ref target="https://www.mysql.com">https://www.mysql.com</ref> [letzter
                                                  Zugriff 15. Oktober 2015]. </bibl>
                                                  <bibl>
                                                    <hi rend="bold">TEI Consortium</hi> (2015): <hi rend="italic">Guidelines for
                                                    Electronic Text Encoding and Interchange. Version 2.8.0 </hi>
                                                    <ref target="http://www.tei-c.org/Vault/P5/2.8.0/doc/tei-p5-doc/en/html/"
                                                      >http://www.tei-c.org/Vault/P5/2.8.0/doc/tei-p5-doc/en/html/</ref>
                                                      [letzter Zugriff 15. Oktober 2015]. </bibl>
                                                      <bibl>
                                                        <hi rend="bold">Wikimedia Foundation</hi> (2015): <hi rend="italic"
                                                        >Wikipedia</hi>
                                                        <ref target="http://www.wikipedia.org">http://www.wikipedia.org</ref>
                                                        [letzter Zugriff 15. Oktober 2015]. </bibl>
                                                      </listBibl>
                                                    </div>
                                                  </back>
                                                </text>
                                              </TEI>