DHd Newsfeed

Im Spannungsfeld zwischen Annotation und Interpretation – „Übersetzung“ als Grundlage der digitalen Geisteswissenschaften

dhd-blog - Di, 03/24/2020 - 16:15

Dass die DHd 2020 mit ihrem Thema „Spielräume“ nicht nur am Puls der Zeit, sondern den europäischen Entwicklungen aufgrund des Coronavirus sogar einen Schritt voraus war, ahnte zum Zeitpunkt der Abhaltung der größten Konferenz zu den digitalen Geisteswissenschaften im deutschsprachigen Raum noch niemand.

Aber von Anfang an: Als im Jahr 2019 der Verband „Digital Humanities im deutschsprachigen Raum“ dazu aufrief, Konferenzbeiträge zum Thema „Spielräume“ einzureichen, war mein Interesse gleich geweckt. Als Translationswissenschafterin habe ich es immer mit Spielräumen zu tun, seien es Spielräume beim Übersetzen, Spielräume durch Technologie oder methodische Spielräume. Eines meiner Forschungsthemen, nämlich maschinelle Übersetzung – und wie maschinelle Übersetzung Spielräume eröffnet und einschränkt – passte perfekt zum Thema. Das sahen die anonymen Gutachter*innen der Tagung  glücklicherweise auch so, und mein Beitrag „Sprachvarietätenabhängige Terminologie in der neuronalen maschinellen Übersetzung“ wurde angenommen. Dass ich überhaupt an der DHd 2020 in Paderborn teilnehmen konnte, habe ich übrigens den Reisestipendiengeber*innen (DHd-Verband und CLARIAH-DE) zu verdanken.

DHd-Ersti

Ihren Auftakt fand die Digital Humanities-Tagung im Heinz Nixdorf MuseumsForum, dem größten Computermuseum der Welt, in dem wir vor der offiziellen Eröffnung herumwandeln durften. In ihrer Eröffnungsrede setzte Julia Flanders den Rahmen für die diesjährige Tagung: Digital Humanities zwischen Modellierung und Interpretation.

Von den ersten Zahlentafeln bis hin zu Robotern mit künstlicher Intelligenz – Besuch im Heinz Nixdorf MuseumsForum im Vorfeld der DHd 2020.

Bei den Stadtführungen konnten die Besucher*innen der DHd 2020-Tagung Näheres über Paderborn erfahren. Am Ausgangspunkt, dem Rathaus, fand auch die Verleihung der Reisestipendien an Nachwuchswissenschafter*innen statt.

Zusammenspiel von Annotation und Interpretation

Im Zuge meines erstmaligen Besuchs einer DHd-Tagung war es interessant zu sehen, in welchen Spannungsfeldern sich die digitalen Geisteswissenschaften bewegen und welche Spielräume sich durch digitale Werkzeuge und Methoden in den Geisteswissenschaften eröffnen, sich aber vielleicht auch verschließen. So tragen z.B. Annotation und Modellierung dazu bei, neue Fragestellungen zu beantworten, aber sie können auch die Perspektive und damit den Interpretationsspielraum einschränken.

Das zeigte sich in vielen Vorträgen, z.B. bei der Annotation von handschriftlichen Partituren berühmter Komponisten, die stark von der Kenntnis der Schreibgewohnten des Komponisten beeinflusst wird und durch die Normierung mittels Repräsentationssprachen wie TEI Interpretationsspielräume (noch weiter) verengt. Ein anderes Beispiel ist das Annotieren literaturwissenschaftlicher Texte, bei dem hermeneutische Textarbeit und deskriptive Textanalyse Hand in Hand gehen können und es einen unterschiedlichen Formalisierungsgrad der Texterschließung gibt.

Maschinelle Übersetzung und (terminologische) Spielräume

Am Freitag war mein Moment „im Rampenlicht“ gekommen: Mein „großer“ Auftritt vor einem – na ja, zugegebenermaßen – eher kleinen Kreis. Es ging in meinem Vortrag um sprachvarietätenabhängige Terminologie in der neuronalen maschinellen Übersetzung. Ziel war es, Bewusstsein dafür zu schaffen, dass es nicht nur eine Version der deutschen Sprache – auch nicht der Terminologien in den deutschen Fachsprachen – gibt und maschinelle Übersetzung zu einer Einschränkung der sprachlichen Spielräume (und zu Missverständnissen) führen kann, wenn in erster Linie die deutsche Standardvarietät der deutschen Sprache im Output von maschinellen Übersetzungssystemen vorkommt.

Nach einem amüsanten Posterslam, bei dem nicht nur gedichtet und gesungen, sondern auch geboxt wurde, konnten sich die Teilnehmer*innen in der Postersession der DHd 2020 untereinander austauschen.

Was bleibt von der DHd 2020 (hängen)?

Was ich von der DHd 2020 mitgenommen habe:

Die digitalen Geisteswissenschaften bewegen sich im Spannungsfeld zwischen veralteten Strukturen und neuer Technologie. Sie erfordern ein Umdenken in den „traditionellen“ Geisteswissenschaften und vor allem auch interdisziplinäreres Denken (in #DHfromScratch).

Die Begleitung des digitalen Wandels ist ein experimentelles Feld. Daher gilt es, Wagnisse einzugehen und eine Fehlertoleranzkultur aufzubauen.

Operationalisierung ist wichtig für Mensch und Maschine. Die Interpretation am Ende einer Forschungstätigkeit sollte immer unter Berücksichtigung der im Laufe der Forschung getroffenen Operationalisierungsentscheidungen erfolgen, z.B. anhand der Auswahl der Korpora oder der Trainingsparameter für maschinelle Lernverfahren. Die Bewertung von Ergebnissen sollte daher im Einklang mit der Bewertung des Weges zu diesen Ergebnissen vorgenommen werden.

Das Arbeitsinstrument Computer eröffnet viele Möglichkeiten bezüglich Methoden, Ressourcen und Werkzeugen. Die dafür erforderliche Formalisierung, z.B. in Form von TEI, kann Spielräume eröffnen, aber auch einschränken.

Zu den Werkzeugen, die ich wiederverwenden werde, zählen u.a.: Kompakkt für die Annotation von digitalen 3D-Objekten, CATMA für Textannotation und -analyse bzw. Textbeschreibung und -auslegung, sowie autoChirp, um Tweets im Voraus zu planen.

Humanities Commons könnte eine interessante (nicht kommerzielle) Alternative zu ResearchGate und Academia für Geisteswissenschafter*innen sein, um sich selbst und die eigenen Forschungsleistungen zu präsentieren.

Die digitalen Geisteswissenschaften spielen eine wichtige Rolle für den Erhalt des kulturellen Erbes. Das Sammeln, Ordnen (z.B. mittels Metadaten) und Bewahren sind Formen der systematischen Wirklichkeitserschließung. Objekte in Sammlungen befinden sich am Spannungsfeld zwischen dem ihnen eingeschriebenen, aber aktuell abwesenden kulturellen Kontext. Neben der Bedeutung, die Objekte anno dazumal hatten, erfahren sie durch ihre Anordnung im Raum in Sammlungen oder durch ihre Digitalisierung einen neuen kulturellen Kontext.

Annotation und Interpretation sind untrennbar miteinander verbunden. Um die Objektivität von Annotationen zu erhöhen, kann auf das inter-annotator agreement zurückgegriffen oder Annotationen gegenseitig Korrektur gelesen werden. Außerdem kann durch Meta-Annotation die eigene Annotation angereichert werden, um die Entscheidungen hinter der jeweiligen Annotation nachvollziehen zu können.

Die Digital Humanities haben viel mit „Übersetzen“ zu tun

Als Übersetzerin war es besonders spannend zu beobachten, dass die Grundlage der digitalen Geisteswissenschaften das „Übersetzen“ ist: Übersetzen in Annotation, Übersetzen in Modellierung, Übersetzen in TEI usw. Ohne eine „Übersetzung“ des Forschungsmaterials in Modelle oder Repräsentationssprachen gäbe es also keine Digital Humanities.

Über die Autorin:

Barbara Heinisch ist Forschende und Lehrende am Zentrum für Translationswissenschaft der Universität Wien. In ihrer Dissertation beschäftigt sie sich mit der Usability der Terminologiedatenbank der Universität Wien. Ihre Forschungsinteressen sind Lokalisierung, Technische Dokumentation, Usability, Barrierefreiheit, Terminologie, Fachübersetzung, maschinelle Übersetzung und Citizen Science. Außerdem ist sie Mitentwicklerin des Sprachressourcenportals Österreichs und arbeitet an diversen Forschungsprojekten, wie dem Citizen Science-Projekt „In aller Munde und aller Köpfe – Deutsch in Österreich“. Auf der DHd 2020 war sie mit dem Beitrag „Sprachvarietätenabhängige Terminologie in der neuronalen maschinellen Übersetzung“ vertreten.

Aufruf zur Projekteinreichung

dhd-blog - Mo, 03/23/2020 - 12:29

Die Deutsche Nationalbibliothek bietet ihre Datenbestände und digitalen Sammlungen für Wissenschaft und Forschung sowie für experimentelles und kreatives Arbeiten im Rahmen des rechtlich und technisch Möglichen an. Unsere digitale Sammlung umfasst einen ständig wachsenden Fundus unterschiedlicher Medienarten.

Gerne unterstützen wir Sie bei Ihrem Forschungsvorhaben im Rahmen unserer Möglichkeiten. Auf die Regelungen des § 60 d UrhG weisen wir ausdrücklich hin. Ferner weisen wir darauf hin, dass derzeit diese Regelungen im Gesetzgebungsverfahren an die Vorgaben des Europarechts angepasst werden.

Wenn Sie Ideen zu Forschungsprojekten haben, zu denen wir mit unserer Sammlung beitragen können, freuen wir uns über eine kurze Projektskizze, die Sie bitte bis zum 30. April 2020 per Mail an Herrn Dr. Peter Leinen (fblit@dnb.de) senden.

Ihre Projektskizze sollte folgende Aspekte adressieren:

  • Fragestellung und Zielsetzung
  • Beschreibung des benötigten Datenkorpus
  • Benötigte technischen Ausstattung (Hardware, Software)
  • Angaben zur geplanten Dauer des Projekts

Die Zahl gleichzeitig laufender Projekte ist beschränkt, weshalb wir gegebenenfalls eine Auswahl treffen müssen. Eine Entscheidung wird Ihnen bis zum 15. Juni 2020 mitgeteilt.

TextGrid in der Lehre zur Unterstützung der funktionalen Textanalyse in Liebesbriefen

dhd-blog - Sa, 03/21/2020 - 18:48

Seit dem Sommersemester 2019 wird an der Universität Koblenz-Landau am Institut für Germanistik im Übungsseminar “Funktionale Textanalyse” (unter der Leitung von Prof. Dr. Eva L. Wyss und Dr. Canan Hastik) die konventionelle Textanalyse mit digitalen computerphilologischen Analysemethoden und -werkzeugen kombiniert und erprobt. Die Zielgruppe, Germanistikstudierende mit Schwerpunkt Lehramt, haben in der Regel weder Erfahrung im Umgang mit TextGrid noch mit anderen digitalen Text-Analysewerkzeugen.

Abbildung 1: Auszug eines Briefes (LB_00688_0013) von 1929 und Transktipt mit Auszeichnungen

In einem ersten Schritt erfolgt eine theoretische Einführung in die funktionale Textanalyse mit Fokus auf Abgrenzungshinweise, Hinweise zur Textfunktion und Merkmalen zur Textualität. Hier werden am Beispiel der alltagssprachlichen Briefe des Liebesbriefarchivs Koblenz relevante Hinweiskategorien und entsprechende Belege zu diesen textlinguistischen Ebenen gesammelt. Dabei wird schnell deutlich, dass durch die Kontextabhängigkeit der Textfunktionen die Bestimmung der funktionalen Kategorien nicht immer eindeutig ist und es durchaus vorkommt, dass sich darüber hinaus bisweilen die einzelnen Analyseebenen nicht immer klar voneinander abgrenzen lassen und sich teilweise sogar überschneiden können (z.B. bei “salute” und “closer”) (s. Abbildung 1). Diese methodologischen Herausforderungen werden in den Arbeitsgruppen durch angeregte Diskussionen identifiziert und in vorläufige – auch explorative – Definitionen überführt.  

Die virtuelle Arbeitsumgebung TextGrid wird zur Unterstützung der kollaborativen Arbeit eingesetzt. Mit dem TextGrid Laboratory ist ein Zugriff auf fachwissenschaftliche Werkzeuge, Services und Inhalte gegeben. Das TextGrid Repository garantiert darüber hinaus die langfristige Verfügbarkeit und Zugänglichkeit geisteswissenschaftlicher Forschungsdaten, hier der korrigierten Transkripte aus dem Liebesbriefarchiv. In der Vorbereitung wird pro Seminar bei 30 Teilnehmer*innen die Anwendung über einen DARIAH-Account installiert. Dies gelingt grundsätzlich gut, aber die Heterogenität der zur Lehrveranstaltung mitgebrachten Arbeitsgeräte erfordert eine enorme Einsatzbereitschaft der Lehrkräfte. Nicht zuletzt ist es die sehr gut aufbereitete Dokumentation der virtuellen Arbeitsumgebung, die die Herstellung der Arbeitsumgebung für alle Seminarteilnehmer*innen unterstützt und fördert.

Die TextGrid-Einführung und -Übung stellt die wichtigsten Werkzeuge des TextGridLab und deren grundlegende Funktionen vor, insbesondere auch die Objektverwaltung. Dies bildet auch einen Schwerpunkt der Veranstaltung, in der die Objektverwaltung mit den Funktionen, Dateien anlegen, importieren und exportieren, Metadatenverwaltung und -pflege gelernt und geübt wird. Dies erfolgt in einer ersten Übungsphase mit wissenschaftliche Transkriptionen einer Auswahl an Briefen, die nach einem zuvor für den Liebesbriefbestand optimierten Set an Richtlinien generiert wurden. In einem weiteren Übungsschritt werden in diesen Transkriptionen textstrukturelle Komponenten, wie Anrede und Grußformel sowie Liebeserklärungen ausgezeichnet. Dies ermöglicht und erzeugt zugleich eine textpragmatische Sicht auf den Bestand (s. Abbildung 2).

Abbildung 2: Konkordanz der Liebeserklärungen (declove) des Briefbündels LB_00688 des LBA, erstellt mit AntConc (21.3.2020).

In einer dritten und letzten Übungsphase werden eigene Fragestellungen zu den gruppenweise zu bearbeitenden Briefsamples formuliert und mit text- und korpusbasierten Analyseinstrumenten untersucht und überprüft. 

Auch im kommenden Semester wird TextGrid wieder als virtuelle Arbeitsumgebung in dem Seminar eingesetzt und ermöglicht damit, den Bestand nicht nur weiter zu erschließen und ihn zugänglich zu machen, sondern gleichzeitig die Nutzung von TextGrid im Rahmen fachspezifischer Verarbeitungspipelines zu erproben und den wissenschaftlichen und didaktischen Wert des Instruments TextGrid idealerweise zur Darstellung zu bringen. 

 

Seiten

Workingpapers DHd-Arbeitsgruppen Aggregator abonnieren