dhd-blog

dhd-blog Feed abonnieren
Digital Humanities im deutschsprachigen Raum
Aktualisiert: vor 1 Stunde 31 Minuten

„Johann Friedrich Blumenbach – Online“. Stellenausschreibung der Akademie der Wissenschaften zu Göttingen

Mi, 02/21/2018 - 14:50

Die Akademie der Wissenschaften zu Göttingen

sucht für die Forschungsstelle des Vorhabens „Johann Friedrich Blumenbach – Online“ in Göttingen zum 1. Mai 2018

eine/n wissenschaftliche/n Mitarbeiterin/Mitarbeiter

für die Edition der gedruckten Publikationen von Johann Friedrich Blumenbach.
Zeitraum: zunächst zwei Jahre, Verlängerung möglich
Vergütung: E 13 TV-L (bei Erfüllung der Eingruppierungsvoraussetzungen)
Stellenumfang: Vollzeit (100%)

Ihre Qualifikationen: Mit überdurchschnittlichem Erfolg abgeschlossenes Hochschulstudium in einem der nachfolgend genannten Fächer:
– Wissenschaftsgeschichte oder Geschichte (Schwerpunkt 18. u. 19. Jh.)
– Kulturwissenschaften (Schwerpunkt 18. u. 19. Jh.)

Wünschenswerte nachweisbare Zusatzqualifikationen, falls nicht durch das Studium abgedeckt:
– Erfahrung im Umgang mit naturwissenschaftlichen Texten des 18. und frühen 19. Jahrhunderts und musealen Objekten
– Editionserfahrung
– gute Lateinkenntnisse und Fremdsprachenkenntnisse in einer der nachstehenden Sprachen: Englisch, Französisch, Italienisch, Dänisch, Niederländisch oder Russisch
– Kenntnisse in digitaler Textbearbeitung in TEI, Datenbankprogrammen und HTML

Vorausgesetzt werden Teamfähigkeit, Bereitschaft zu interdisziplinärer Zusammenarbeit und hohe wissenschaftliche Präzision. Wissenschaftliche Qualifizierungen sind möglich. Arbeitsort ist Göttingen.
Tätigkeit: Tiefenerschließung von elektronischen Volltexten mittels TEI-XML im Rahmen der Erstellung der Online-Edition der publizierten Werke Johann Friedrich Blumenbachs.
Die Akademie der Wissenschaften zu Göttingen ist dem Gleichbehandlungsgrundsatz verpflichtet und fördert die berufliche Gleichstellung von Frauen und Männern. Schwerbehinderte Menschen werden bei entsprechender Eignung besonders berücksichtigt.

Bewerbungen sind per E-Mail (Anhang in nur einer Datei) mit den üblichen Unterlagen bis zum 31.03.2018 zu richten an:

Dr. Heiko Weber
Akademie der Wissenschaften zu Göttingen
Johann Friedrich Blumenbach – Online
Geiststraße 10

37073 Göttingen
Tel.: 0551 – 39 2 15 65
E-Mail: hweber@gwdg.de

Bewerbungskosten werden nicht erstattet. Sämtliche Unterlagen werden nach Abschluss des Verfahrens vernichtet. Rückfragen richten Sie bitte per E-Mail an Dr. Heiko Weber; Informationen zur Forschungsstelle auch unter https://adw-goe.de/forschung/forschungsprojekte-akademienprogramm/johann-friedrich-blumenbach-online/ sowie www.blumenbach-online.de

Ausschreibung DARIAH-DE DH-Award 2018

Di, 02/20/2018 - 17:08

DARIAH-DEDigitale Forschungsinfrastruktur für die Geistes- und Kulturwissenschaften ist der deutsche Beitrag zum europäischen Forschungsverbund „DARIAH-EU – Digital Research Infrastructure for the Arts and Humanities“. DARIAH-DE entwickelt eine digitale Forschungsinfrastruktur für Werkzeuge und Forschungsdaten und unterstützt die mit digitalen Ressourcen und Methoden arbeitenden Geistes- und Kulturwissenschaften in den Digital Humanities. Die 2008 begonnene Entwicklung der DARIAH-DE Forschungsinfrastruktur brachte in den 10 Jahren bedeutende Veränderungen der Digital Humanities in der Lehre und Forschung. Um diese Veränderungen zu verstetigen, benötigen die Digital Humanities eine aktive und zukunftsgewandte Nachwuchsförderung, um lebendige Forschungsnetzwerke entstehen zu lassen. DARIAH-DE unterstützt und fördert seit 2014 mit dem DARIAH-DE DH-Award Studierende und NachwuchswissenschaftlerInnen in ihrer Forschung, insbesondere solche Projekte, die bereits interdisziplinär arbeiten und forschen.

2018 wird der DARIAH-DE DH-Award in zwei Kategorien ausgelobt:

Der DARIAH-DE DH-Award 2018 „Studien und Konzepte“ zeichnet innovative Forschungsbeiträge von Studierenden und NachwuchswissenschaftlerInnen aus, die sich auf hohem theoretischen Reflexionsniveau mit digitalen Methoden und Infrastukturen beschäftigen.

Der DARIAH-DE DH-Award 2018 „Tools und Projekte“ zeichnet innovative Forschungsbeiträge von Studierenden und NachwuchswissenschaftlerInnen aus, die mit digitalen Ressourcen und/oder digitalen Methoden arbeiten.

Ziele des DARIAH-DE DH-Awards sind die Sichtbarmachung neuer und innovativer Ansätze in den Digital Humanities, Präsentation der Nachwuchs-Arbeiten in einem interdisziplinären, internationalen Umfeld sowie nationale und internationale Kommunikation der Entwicklung digitaler Geisteswissenschaften.

Neben der finanziellen Unterstützung ist dem DARIAH-DE DH-Award 2018 insbesondere die ideelle Unterstützung im Kontext eines großen Verbundvorhabens ein besonderes Anliegen. Die Preise im Wert von je 600 Euro werden am 21.09.2018 im Rahmen der DARIAH-DE Grand Tour 2018 in Darmstadt verliehen. Während der Tagung (19.-21.09.2018) haben die PreisträgerInnen die Möglichkeit, ihre Arbeit einem breiten Fachpublikum vorzustellen. Die Reise- und Übernachtungskosten, sowie Teilnahmegebühren werden übernommen.

Einsendeschluss ist der 31.05.2018.

Weitere Informationen: https://de.dariah.eu/dariah-dh-award-2018-ausschreibung

 

Einreichungen zur DHd 2018

Mo, 02/19/2018 - 16:05

Ulrike Henny-Krahmer (Würzburg), Patrick Sahle (Köln)

Die fünfte Tagung des Verbands DHd wird vom 26. Februar bis zum 2. März 2018 in Köln unter dem Motto “Kritik der digitalen Vernunft” stattfinden. Bereits eine gewisse Tradition hat die quantitative Auswertung von Einreichungen und ggf. auch Begutachtungen sowie Annahmen und Ablehnungen zu Konferenzen in den Digital Humanities. Beiträge zur internationalen DH-Konferenz der ADHO werden z.B. regelmäßig von Scott Weingart analysiert, aber auch die DHd-Einreichungen sind 2016 bereits von José Calvo Tello untersucht worden. Werden die eingereichten Beiträge kontinuierlich untersucht, können die Ergebnisse einen interessanten Überblick darüber geben, wie sich das Interesse an den Konferenzen entwickelt, welche Forschungsthemen im Zentrum der DH und welche Menschen, Orte und Institutionen hinter den Konferenzbeiträgen stehen. Handelt es sich vor allem um individuelle Forschung oder Arbeit im Team? Wie ist das Geschlechterverhältnis bei den Einreichungen? Woher kommen die Forschenden und welche Institutionen sind über Kooperationen miteinander verbunden?

Im Folgenden wird ein Export der Daten aus dem Konferenz-Managementsystem Conftool für die “Quantifizierung der DHd2018” verwendet. Mit den Basiszahlen werden einige grundlegende statistische Übersichten zu den Einreichungen gegeben. Im Fokus stehen außerdem die AutorInnen, AutorInnennetzwerke und Themen.

Basiszahlen

Zur Deadline der Konferenz DHd2018 am 25.09.2017, 1:00 Uhr sind insgesamt 187 Beiträge eingereicht worden, die sich wie folgt verteilen:

Beitragstyp Anzahl Vortrag 97 Poster 62 Panel 11 Workshop 17 Summe 187

Tabelle 1: Beiträge nach Typen

Abbildung 1: Anteile der Beitragstypen

Dabei kommt nur ein gutes Viertel der Einreichungen von einzelnen Autoren. Knapp drei Viertel sind das Ergebnis von Teamarbeit:

Abbildung 2: Anteile von Einzel- und Teameinreichungen

Wir folgen hier für die Vergleichbarkeit und für einen ersten Eindruck dem Ansatz von Scott Weingart, halten ein Liniendiagramm (wie er es einsetzt) aber für methodisch unzulässig, da es ja keine Zwischenstufen zwischen den Einreicherzahlen gibt. Wir verwenden daher ein Balkendiagramm. Ergänzend verdeutlicht das Kuchendiagramm die Anteile von Einzeleinreichungen (27,3%) im Vergleich zu Teameinreichungen (insgesamt 72,7%). Wie in Abb. 2 zu sehen, ist der allgemeine Trend, dass die Anzahl der Einreichungen mit der Teamgröße abnimmt.

Vergleicht man diese Zahlen mit den Verhältnissen bei den internationalen DH-Konferenzen, für die Weingart über die Jahre hinweg ähnliche Anteile feststellen konnte, so ist die Rate der Einzeleinreichenden bei der DHd2018 noch geringer als bei der globalen DH. Bei der DH2017 betrug sie z. B. 39,6 %. Zweiterteams hatten dort eine Quote von 24,5 % (DHd 23%), Dreierteams von 16,3 % (DHd 18,2%) und Vierer-Teams von 7,2 % (DHd 12,3%). Einreichungen von zwei AutorInnen gab es also bei der DH-Konferenz in Montréal noch geringfügig mehr als bei der DHd2018, Beiträge von größeren Teams sind aber bei der DHd-Konferenz häufiger vertreten.

Naheliegend ist die Frage, welchen Einfluss der Beitragstyp darauf hat, ob es sich um eine individuelle oder eine Teameinreichung handelt und wie groß die Teams sind. Die inhaltliche Frage lautet also eigentlich: wie verteilen sich die Einreicherkonstellationen auf die verschiedenen Arten von Beiträgen? Zu erwarten ist intuitiv eine höhere Koautorschaftsrate vor allem bei Panels und Workshops.

Abbildung 3: Einreichungen mit x AutorInnen in % (nach Beitragstyp)

Tatsächlich sind vor allem Vorträge individuell oder mit wenigen KoautorInnen eingereicht worden: 34% aller eingereichten Vorträge haben eine Autorin/einen Autor. Die höchste Zahl an Einreichenden wird allerdings nicht mit einem Panel oder Workshop, sondern mit einem Poster erreicht. Trotzdem sind je 25,8% der Poster-Einreichungen individuell oder mit zwei KoautorInnen erfolgt. Insgesamt ist der Verlauf für die Anzahl an AutorInnen bei Postern demjenigen bei Vorträgen relativ ähnlich. Anders sieht es bei Panels und Workshops aus, wo es keine relativ stetige Abnahme an Einreichungen mit höherer Koautorschaftszahl gibt, sondern einen höheren mittleren Bereich. Für Panels sind vier bis sieben Einreicher typisch (weil OrganisatorInnen und PanelistInnen häufiger zusammen einreichen?), bei Workshops liegt die Zahl der Einreichenden vor allem zwischen zwei und vier. Man beachte, wie hier stark geglättete Kurven genutzt werden, nicht um tatsächliche Zahlenwerte zu visualisieren, sondern einen zusammenfassenden, am grundsätzlichen Trend orientierten Eindruck zu geben.

Es scheint insgesamt sinnvoll, Typen von Gruppen festzulegen, um einen besseren Überblick über den Zusammenhang von Einreicherkonstellationen und Beitragstypen zu bekommen. Naheliegend ist hier eine Gruppierung in “Einzelbeitrag”, “Duo”, “Kleingruppe” (3-5) und “Großgruppe” (>5). Geht man davon aus, dass Panel und Workshops ihrer Natur nach ohnehin meistens von Teams organisiert werden (Einzeleinreichungen waren die Ausnahme), bleiben die Poster und Vorträge besonders interessant. Hier liegt die Quote der Einzeleinreichungen bei 26% (Poster) bzw. 34% (Vorträge). Auch der Durchschnitt der Autorenzahl mit 3,1 bei Postern und 2,5 bei Vorträgen zeigt, dass Poster in noch größerem Maße Teamarbeit als Vorträge sind. Für diese beiden Formate zeigen sich die folgenden Konstellationen:

Abbildung 4: Einreicherkonstellationen für Paper und Poster

Eine mögliche Erklärung liegt wohl darin, dass Poster häufiger auf Projekte bezogen sind, die in den DH meistens in Teamarbeit durchgeführt werden. Dagegen sollten Vorträge eher einzelne Forschungsfragen behandeln. Dass selbst dabei die Quote der Einzelbeiträger nur ein Drittel beträgt, zeigt wie das Muster kollaborativer Forschung sich auch auf diesen Bereich erstreckt. Oder, dass auch die Vorträge in Wirklichkeit projektbezogen sind. Aber um das zu untersuchen, müsste man die Daten weiter anreichern und die Vortragsthemen klassifizieren.

AutorInnen

Die Beiträge haben insgesamt 553 AutorInnen, davon 449 verschiedene. 62 AutorInnen waren an zwei Beiträgen beteiligt, 19 an drei bis fünf Einreichungen. Diese Zahlen sind vor dem Hintergrund zu diskutieren, dass vom Programmkomitee folgende Vorgabe gemacht worden ist:

“In der Regel wird erwartet, dass von einem Verfasser/einer Verfasserin/einer Projektgruppe nur ein Poster oder Vortrag eingereicht wird. Eine Beteiligung von Beitragenden darüber hinaus an maximal einem Panel oder Workshop ist jedoch möglich.”

Diese Politik ist grundsätzlich nachvollziehbar, führt aber in einem stark kollaborativ orientierten Forschungsfeld zu einigen Folgeproblemen. Was macht man, wenn man an mehreren Projekten beteiligt ist? Dann können die Partner aus einem zweiten Projekt ja nicht dafür in Kettenhaftung genommen werden, dass die Partner in einem ersten Projekt schon etwas eingereicht haben, auf dem auch der eigene Name steht.

Die Deutung von Begriffen wie “oder” und “in der Regel” ist offenkundig von den Einreichenden vorgenommen und unterschiedlich getroffen worden. Außerdem könnte man argumentieren, dass es einen engen und einen weiten Begriff von “einreichen” geben kann: die Person, die hochlädt versus alle an einer Einreichung beteiligten. Wenn man von einem engen Begriff ausgeht, wäre es möglich, als Autor an beliebig vielen Einreichungen beteiligt zu sein, solange nur alle Einreicher (Hochlader) nur einmal als solche auftreten. Schließlich könnte man sich auch auf die Formulierung “von einer Projektgruppe” zurückziehen. Damit könnte man dann auch fünf Beiträge einreichen, wenn man an fünf Projekten beteiligt ist.

Will man die Community nicht in den Exegesesumpf schicken und die Folgsamen (“ich lese: nur ein Beitrag”) nicht gegenüber den Zügellosen (“Regeln? Doch nicht für mich!”) in Nachteil bringen, dann wären sicher auch einfachere und transparentere Regelungen und Formulierungen möglich:

  1. Eine strikte Maximalzahl von Gesamtbeteiligungen, unabhängig vom Status als Einreichenden und Beitragenden, die dann für alle gleichermaßen gelten würde. Dabei wäre eine niedrige Zahl problematisch wegen der oben angesprochenen Folgeprobleme. Mit drei bis fünf würde aber dem kollaborativen Charakter des Feldes Rechnung getragen und zugleich trotzdem ein sinnvolles Limit für die Zahl der Einreichungen gesetzt werden.
  2. Eine Maximalzahl pro Beitragsstyp. Z.B. ein Vortrag, zwei Poster, ein Panel, ein Workshop.
  3. Eine Differenzierung nach Beteiligungsstatus. Z.B. nach der Regel “nur einmal als Haupt-Einreichende auftreten, ansonsten aber beliebig viele Beteiligungen”. Ähnlich wäre ein Verfahren, das den Status “vortragende/r AutorIn” berücksichtigt. Diese Markierung wird z.B. bei der internationalen DH-Konferenz genutzt. Und auch hier könnte man sagen “nur ein/zwei Vorträge aber beliebig viele (oder maximal X) Beteiligungen”.

Wo kommen die AutorInnen her? Um an genaue Zahlen zu kommen, müsste man die zugeordneten Organisationen auswerten, was relativ aufwändig wäre. Einen unscharfen ersten Eindruck können bei aller Vorsicht auch die eMail-Adressen vermitteln. Dabei sind jenseits der klaren Länderkennungen nur noch die unspezifischen Domains aufzulösen (edu, net, org, com, eu), für die hier stillschweigend die Personen anhand ihrer Institutionen den jeweiligen Länder(gruppen) zugeordnet sind.

Abbildung 5: AutorInnen nach Ländern

Auffällig ist hier die enorme Unterrepräsentanz der Schweiz. Diese war aber auch schon für die Tagung 2016 in Leipzig von José Calvo Tello festgestellt worden. Rechnet man auf Einwohnerzahlen um, dann ergeben sich für die Länder 6,8 (AT) bzw. 5,4 (DE) bzw. 1,2 (CH) Beiträge je einer Million Einwohner.

Geht man weiter auf die geografische Verteilung der AutorInnen ein, dann zeigen sich gewisse lokale Zentren in den Digital Humanities. Es gibt 18 Orte[1] mit mehr als zehn “Beiträgen” in dem Sinne, dass alle AutorInnen aller Beiträge berücksichtigt sind. Das führt natürlich auch dazu, dass einzelne Personen mehrfach gezählt werden, was aber beabsichtigt ist, da es hier nicht so sehr um Personen als vielmehr den Gesamtbeitrag von “Orten” geht.

Köln 58 Göttingen 23 Dresden 13 Berlin 39 Paderborn 20 Frankfurt 13 Würzburg 37 Mainz 19 Tübingen 13 Wien 33 Potsdam 17 Graz 12 Stuttgart 32 Leipzig 17 Moskau 12 Hamburg 24 Passau 15 Nürnberg 12

Tabelle 2: Beiträge nach Orten

Eine gewisse Schieflage könnte man konstatieren, wenn man feststellt, dass aus diesen 18 Orten bereits 409 Beiträge kommen, während aus den weiteren 49 Städten nur 145 stammen. Das bedeutet: aus 27% der Orte kommen 74% der Beiträge. Oder, um leichter vergleichbare Zahlen zu nennen: aus rund 10% der Orte kommen 44% der Beiträge. Die Aussagekraft der Städteliste mag man relativieren, wenn man daran denkt, dass es Beiträge mit zehn oder elf AutorInnen gibt – so dass man schon mit nur zwei entsprechenden Postern oder Panels zu den Top-Ten-Städten gehören könnte.

Abbildung 6: Beitragsorte, erstellt mit WordArt (https://tagul.com)

Interessant wäre eine Untersuchung der Geschlechter. Dies ist allerdings kaum möglich, da nur für die Einreicher das Geschlecht über die eingetragene Anrede bekannt ist. Es ist aber weder davon auszugehen, dass die Einreicher repräsentativ für die Gesamtmenge der Beiträger sind, noch dass sie eine besondere Gruppe bilden würden. Wir können (auch wegen der oben angesprochenen Frage der Mehrfacheinreichungen) außerdem nicht davon ausgehen, dass die Einreicher immer auch die HauptautorInnen eines Beitrages wären. Nennen kann man die Zahlen aber trotzdem: ziemlich genau ein Drittel (61) der Beiträge ist von Frauen eingereicht worden, die anderen zwei Drittel (126) von Männern.

Ähnlich sieht es für das Alter der Beitragenden aus. Auch hier ist die Datengrundlage zu dürftig, um zu belastbaren Aussagen zu kommen. Nur für 92 Personen ist im Konferenzsystem ein Geburtsjahr erfasst. Über die Repräsentativität können wir nichts sagen. Dass für diese 92 ein erstaunlich niedriges Durchschnittsalter von 40 Jahren zu ermitteln ist, kann deshalb bis auf weiteres nicht mehr als eine Randbemerkung sein.

Für die soziologische Struktur des Feldes wäre ansonsten noch der akademische Status interessant. Auch hier ist es aber leider so, dass viele Beitragende ihre Titel, also Dr. oder Prof., nicht angeben und die Datengrundlage deshalb unzuverlässig ist. Dabei würden sich u.a. neben den allgemeinen Quoten auch diese beiden Abgleiche für eine Untersuchung anbieten:

  1. Welche ProfessorInnen, die in der Liste der DH-Professuren seit 2008 erfasst sind, beteiligen sich an der Jahrestagung des DH-Verbandes?
  2. Welche Dominationen haben die Lehrstühle der übrigen beitragenden ProfessorInnen?

Dahinter steckt eine der Fragen nach Selbstverständnis und Formierung der Digital Humanities: Verstehen sich Inhaber von “Professuren für DH” (in dem weiten Sinne der o.g. Liste) dann auch wirklich als Teil jener DH-Community, die sich auf der Jahrestagung des Verbandes trifft? Und anders herum: welche ProfessorInnen auf “normalen” Lehrstühlen beteiligen sich an den DH? Welche Fächer sind hier vertreten?

Von den 33 ProfessorInnen auf der o.g. Liste haben 14 (42%) eingereicht, 19 haben sich nicht aktiv beteiligt. Nun müsste man vielleicht noch die Teilnehmerdaten abwarten um zu sehen, wie hoch der Identifikationsgrad und wie die Überschneidung von “DH-Professuren in einem recht weiten Verständnis” und “der zentrale Kongress des Faches” ist. Bei einer ersten Sichtung der Beiträger lassen sich mindestens 32 weitere ProfessorInnen identifizieren, die entweder für DH stehen (ohne auf der o.g. Liste aufzutauchen) oder aus den verschiedensten Fächern kommen. Hier fallen besonders die Informatik sowie die verschiedenen Sprach- und Literaturwissenschaften in’s Auge. Zu den geringer vertretenen Gebieten gehören noch die Geschichte, Kunstgeschichte oder Archäologie. Weitere sind ganz vereinzelt.

AutorInnennetzwerke

AutorInnen reichen gemeinsam ein und sie reichen – trotz der offiziellen Ein-Beitrag-Politik – mehrfach ein. Dadurch ergeben sich EinreicherInnennetzwerke, die sich visualisieren lassen:

Abbildung 7: EinreicherInnennetzwerke

In der Grafik sind Einzeleinreichungen ausgeblendet. Die Farben der Knoten stehen für verschiedene Orte. Die Positionierung der Knoten ergibt sich zufällig aus dem Visualisierungsalgorithmus für das Netzwerk.[2]

Jenseits der durch Teameinreichungen bedingten Gruppierungen erkennt man einige größere Netze, die durch Mehrfachbeteiligungen einzelner Personen entstehen. Durch die Farbcodierung lässt sich ein Eindruck davon gewinnen, ob Einreichungen bzw. Projektteams und Netze von Einreichungen eher lokal oder ortsübergreifend sind. Insgesamt halten wir die Aussagekraft dieser Netzwerkvisualisierung jedoch für sehr gering. Netzwerke entstehen vor allem auch durch die Zufälligkeit der Beteiligung oder Nicht-Beteiligung einzelner Personen an einem oder mehreren Beiträgen und der Zufälligkeit der Einreichung- oder Nicht-Einreichung von Beiträgen für eine Konferenz. Trotzdem ist es verführerisch, einzelne Netze genauer zu betrachten und für sinnvoll zu halten, weil sie durchaus reale Verbindungen wiedergeben.

Abbildung 8: Ein Teilnetz

Abbildung 8 zeigt eines der größeren Netze mit Beiträgen vor allem aus Würzburg (blau) und Köln (gelb), das zufällig durch ein Panel zusammengehalten wird, an dem TeilnehmerInnen aus verschiedenen Orten beteiligt sind.

Themen

Der Call for Papers für die DHd2018 rief insbesondere zu Einreichungen auf, die sich mit Fragen der Kritik beschäftigen: Kritik der Digitalisierung, digitaler Angebote, Projekte und Werkzeuge, der digitalen Methoden, Methoden der digitalen Geisteswissenschaften, digitaler Wissenstheorie und digitaler Gesellschaft sowie zu allgemeinen Themen der DH. Zu welchen Themen sind nun tatsächlich Beiträge eingereicht worden?

Die AutorInnen hatten im Conftool an zwei Stellen die Möglichkeit, die in der Einreichung behandelten Themen durch Metadaten zu beschreiben. Eine Möglichkeit bestand darin, freie Schlagwörter (“Keywords”) zu vergeben, die zweite darin, bis zu sechs Themen aus einem kontrollierten Vokabular (“Topics”) auszuwählen.

Keywords

Für die Ermittlung der Zahlen zu den frei vergebenen Schlagwörtern wurden diese hier in Kleinschreibung überführt und der Weißraum (evtl. zusätzliche Leerzeichen) normalisiert. Insgesamt wurden 763 Schlagwörter vergeben – davon 578 verschiedene!

Überhaupt kommen nur sieben Schlagwörter fünfmal oder häufiger vor, so dass selbst die “prominentesten” Begriffe nur für marginale Teile der Beitragsmenge stehen:

Schlagwort # Anteil Annotation 12 6,4 TEI 10 5,3 Digitalisierung 8 4,3 Digitale Edition 6 3,2 Ontologie 6 3,2 Visualisierung 5 2,7 Kritik 5 2,7

Tabelle 3: Schlagwörter nach Häufigkeit

Die Schlagwörter haben auf den ersten statistischen Blick nur eine geringe Aussagekraft, da kaum gemeinsame Stichworte vergeben wurden. Man könnte noch versuchen, durch Vereinheitlichung und Gruppierung Stichwörter zusammenzuführen (z. B. durch die Übersetzung fremdsprachiger Begriffe oder die Verbindung von Ober- und Unterbegriffen). Bei einer ersten Sichtung war unser Eindruck aber, dass sich nicht ohne weiteres thematische Korrelationen aufdrängen, so dass sich auch dadurch kein klareres Bild ergeben würde.

Abb. 9 zeigt eine Wordcloud der Keywords, bei der die Größenverhältnisse auf den Häufigkeiten der Vergabe basieren. Für die Wordcloud wurden die Wörter nicht in Kleinschreibung überführt.

Abbildung 9: Wordcloud der frei vergebenen Schlagwörter (keywords), erstellt mit WordArt (https://tagul.com)

Insgesamt ist unser Eindruck, dass die freie Verschlagwortung für zahlenbasierte Auswertungen wenig Nutzen bringt, da offenkundig keine “gemeinsamen” Begriffe verwendet werden und sich dadurch keine Themencluster bilden, keine Felder oder Strukturen zu erkennen sind und über die Zeit auch keine Tendenzen beobachtbar werden können.

Topics

Das kontrollierte Vokabular, das im Conftool für die Vergabe von Topics zur Verfügung stand, wurde aus der Taxonomy of Digital Research Activities in the Humanities (TaDiRAH) abgeleitet. TaDiRAH unterscheidet zunächst die drei Bereiche “Research Activities”, “Research Objects” und “Research Techniques”. Für die ersten beiden Bereiche liegen mit “Aktivitäten” und “Objekte” Übersetzungen ins Deutsche vor, welche in das Conftool eingegangen sind. Allerdings kommt es dabei zu einer gewissen Verschiebung der Hierarchien. In TaDiRAH gibt es bei den Aktivitäten Untergruppen, die dann wiederum die Begriffe für die einzelnen Aktivitäten enthalten. Bei den Objekten ist dies nicht so, es werden direkt die einzelnen Objekte genannt. Auf das Conftool übertragen standen die einzelnen Objekte in einer Gruppe “Objekte” direkt neben den Aktivitäten, die zu Aktivitätengruppen (“Erfassen”, “Analysieren”, usw.) zusammengefasst waren. Es standen sich also nicht die Bereiche “Objekte” vs. “Aktivitäten” direkt gegenüber, sondern die Bereiche “Objekte”, “Erfassen”, “Analysieren”, usw. Man wählt deshalb zwischen den Begriffen in den Aktivitäten-Bereichen “Erfassen”, “Erzeugung”, “Anreichern”, “Analysieren”, “Interpretation”, “Aufbewahren”, “Veröffentlichen” und “Rahmenaktivitäten” und dann aus den Objekt-Begriffen aus. Wir können nicht abschätzen, ob den Einreichenden die grundlegende Zweiteilung in Aktivitäten und Objekte bewusst gewesen ist, möglicherweise spielt das für die Analyse aber auch keine große Rolle. Wir haben dennoch versucht, diese Unterscheidung bei der Auswertung zu berücksichtigen.

Insgesamt standen 75 Begriffe zur Auswahl. 35 in Objekten und 40 in den acht Aktivitäten-Gruppen. Der Begriff “Visualisierung” kommt in beiden Bereichen und damit doppelt vor, was für die Auswertung problematisch ist: Im Ergebnis ist nicht zu unterscheiden, ob dieses Schlagwort als Objekt oder Aktivität ausgewählt wurde.

Für die 187 Einreichungen wurden 976 Themen-Schlagwörter vergeben, also rund fünf Topics pro Beitrag. Von den 75 verfügbaren Begriffen sind 74 verschiedene tatsächlich verwendet worden. Nur “Curricula” wurde keinem Beitrag zugeordnet. Uns erstaunt, dass die Bandbreite der Topics fast vollständig ausgeschöpft wurde. Lediglich fünf der Topics wurden nur ein einziges Mal vergeben (“Übersetzung”, “Datei”, “Schreiben”, “Notenblätter”, “Crowdsourcing”). Es zeigt sich so, dass die DHd-Konferenz die Forschungsaktivitäten und Beschäftigung mit Forschungsobjekten in den digitalen Geisteswissenschaften in ihrer Breite abbildet – zumindest so, wie sie in TaDiRAH beschrieben werden und zumindest zum Zeitpunkt der Einreichungen.

Die Top Ten der Topics sind:

Topic Häufigkeit Modellierung 60 Text 50 Annotieren 48 Inhaltsanalyse 44 Visualisierung 37 Methoden 33 Theoretisierung 29 Programmierung 26 Forschungsprozess 26 Kollaboration 25

Tabelle 4: Topics nach Häufigkeit

Interessant ist die Frage, ob das Tagungsmotto Einfluss auf die Themenwahl hatte (Modellierung? Theoretisierung? Forschungsprozess?). Dazu müssten aber wohl die Vergabe der Topics in den Vorjahren zum Vergleich herangezogen werden. Dann könnte auch untersucht werden, ob es unabhängig vom Tagungsthema Entwicklungen bei den Topics gab.

In Abb. 10 sind die Topics als Wordcloud dargestellt. Wie bei den Keywords ist die Grundlage für die Wortgröße auch hier die Häufigkeit der Vergabe des Topics. Auch an den Wordclouds wird sichtbar, dass die Vergabe von Themen-Schlagwörtern aus dem kontrollierten Vokabular wie erwartet zu einer stärkeren Konzentration auf einzelne Begriffe führt, aber auch, wie die Verschlagwortung dadurch geleitet wird. Da TaDiRAH auf Aktivitäten und Objekte abzielt und auf eine allgemeinere Ebene der Betrachtung, ist ein Schlagwort wie TEI, das einen konkreten Datenstandard bezeichnet und bei der freien Vergabe häufig war, hier gar nicht mehr enthalten. Auf der anderen Seite ist “Text”, auf Platz zwei der Topics, bei den Keywords in der allgemeinen Form gar nicht vergeben worden, sondern nur spezifischer (z. B. “Liedtexte”, ”Nicht-Standardtexte”, “Short Texts”).

Abbildung 10: Wordcloud der vergebenen Topics, erstellt mit WordArt (https://tagul.com)

Wir können nun fragen, wie die Topics innerhalb der beiden Großgruppen vergeben wurden. Die Verteilung der Topics auf die einzelnen Aktivitätengruppen ist wie folgt:

Abbildung 11: Topic-Vergabe nach Aktivitätengruppen

Abb. 11 zeigt, dass alle Aktivitätengruppen vertreten sind. Analyse und Interpretation sind häufiger vergeben als die anderen, dominieren aber nicht die Gesamtheit der vergebenen Schlagwörter.

Will man eine Grundunterscheidung zwischen Daten erzeugenden und Daten auswertenden Aktivitäten machen, dann haben für das Erstere Erfassen, Erzeugen und Anreichern ein Gewicht von 31,9% und für das Letztere Interpretation und Analyse ein Gewicht von 43,4 Prozent. Der Zweischritt, Daten zu erstellen und dann auszuwerten, steht damit für drei Viertel der Aktivitäten. Hinzu kommen Aktivitäten jenseits der Auswertung, zu denen Veröffentlichen und Aufbewahren gehören. Diese machen nur 17,3 % aus.

Auch hier wäre die Frage, ob das Tagungsthema der “Kritik” die Bereiche der Datenerzeugung und -auswertung begünstigt hat. Entsprechend müsste dann ein Topic wie “Aufbewahren” bei der DHd2017 in Bern, wo das Thema “Nachhaltigkeit” hieß, ein höheres Aufkommen gehabt haben.

Abbildung 12: Topic-Vergabe nach Aktivitäten

Bei den Einzeltopics in den Aktivitäten selbst liegen mit Modellierung, Annotieren, Inhaltsanalyse, Visualisierung und Theoretisierung ebenfalls Begriffe vorne, denen man immerhin eine gewisse Nähe zum Fokus “Kritik” unterstellen könnte. Insgesamt sieht man hier aber eine relativ gleichmäßige Verteilung über zahlreiche prominente Topics hinweg (siehe Abb. 12).

Abbildung 13: Topic-Vergabe “Objekte”

Wie zu erwarten führt bei den Objekten der “Text” die Liste der häufig vergebenen Stichworte an (siehe Abb. 13). Im Sinne der Taxonomie müsste “Visualisierung” hier als Forschungsobjekt gemeint sein, die Beiträge also Visualisierungen untersuchen (nicht verwenden). Darüber, in welchem Sinn die vorgegebenen Themen-Schlagwörter tatsächlich eingesetzt worden sind, kann man nur spekulieren. Gerade bei den Visualisierungen scheint es verwunderlich, dass diese als Objekt so weit oben rangieren. Durch die Unklarheit, ob das Topic tatsächlich als Objekt oder als Aktivität ausgewählt wurde, kann der Wert von 9,4 % aber nicht vergleichend gedeutet werden. Zusätzlich haben sie noch Auswirkungen auf die anderen Zahlen, so dass auch deren Deutung problematisch ist.

TaDiRAH hat einen sehr weiten, differenzierten, um nicht zu sagen diffusen Objektbegriff. In einem engeren Verständnis primärer Objekte als Gegenstände digitaler Forschung würde man vielleicht eher eine Gruppe wie Text, materielles Objekt, Bild, Sprache, Notenblätter, Audio etc. erwarten. Darin würde die Dominanz von “Text” gegenüber “Bild” und den anderen genannten Objekttypen noch deutlicher sichtbar werden. Die folgende Tabelle zeigt für einige Objekt-Topics (im engeren Sinne), bei wie vielen Beiträgen sie vergeben wurden:

Topic

# Beiträge (absolut)

# Beiträge (relativ) Text 50 27 % Literatur 24 13 % Sprache 16 9 % Bilder 14 8 % Manuskript 8 4 % Artefakte 7 4 % Ton 3 2 % Notenblätter 1 0,5 %

Tabelle 5: Beiträge mit ausgewählten Objekt-Topics

Die Quantifizierung der Topic-Zuordnungen ist nur ein Weg, diese auszuwerten. Interessant kann es darüber hinaus sein zu untersuchen, welche Themen miteinander verbunden sind. TaDiRAH gibt eine Gruppierung vor, aber bei der Vergabe der einzelnen Topics können diese von den Einreichenden frei kombiniert werden.

Für die Vergabe der Topics bei den einzelnen Beiträgen liegt die Frage nahe, ob es Korrelationen zwischen Schlagwörtern bzw. Schlagwortgruppen gibt. Dies sei hier am Beispiel der Aktivitätengruppen untersucht. Als gemeinsames Vorkommen wurde gewertet, wenn mindestens ein Schlagwort aus der Aktivitätengruppe mit einem anderen Schlagwort aus einer anderen Gruppe kombiniert wurde. In der ersten Zeile von Tab. 6 ist die Gesamtzahl der Beiträge angegeben, die Schlagwörter aus der jeweiligen Aktivitätengruppe haben (z. B. haben 64 Beiträge Schlagwörter aus der Gruppe “Erfassen”). Im mittleren Tabellenbereich ist für jede Aktivitätengruppe ermittelt worden, wie viel Prozent der Beiträge, die Schlagwörter aus der Gruppe haben, auch Schlagwörter aus einer anderen Gruppe tragen (z. B. haben 41 % der Beiträge, die mit Schlagwörtern aus der Gruppe “Erfassen” versehen sind, zugleich auch Schlagwörter aus der Gruppe “Erzeugen”). Die letzte Tabellenzeile schließlich gibt den Kombinationsfaktor an: Mit vielen Schlagwörtern aus anderen Aktivitätengruppen sind die Beiträge ausgehend von der ersten Aktivitätengruppe im Durchschnitt kombiniert (z. B. sind die Beiträge mit Schlagwörtern aus der Gruppe “Erfassen” im Durchschnitt mit 2,4 Schlagwörtern aus anderen Gruppen kombiniert).

Erf. Erz. Anr. Ana. Int. Aufb. Veröff. Rahm.

64

52 56 99 89 28 56 38 Gesamtzahl

50 % 46 % 33 % 27 % 43 % 34 %

29 %

Erfassen

41 %

– 23 % 27 % 20 % 32 % 32 %

26 %

Erzeugen

41 %

25 % – 29 % 26 % 25 % 32 %

18 %

Anreichern

52 %

52 % 52 % – 58 % 14 % 27 %

34 %

Analysieren

38 %

35 % 41 % 52 % – 18 % 36 %

50 %

Interpretieren

19 %

17 % 13 % 4 % 6 % – 29 %

11 %

Aufbewahren

30 %

35 % 32 % 15 % 22 % 57 % –

47 %

Veröffentlichen

17 %

19 % 13 % 13 % 21 % 14 % 32 %

Rahmenaktivitäten 2,4 2,3 2,2 1,7 1,8 2,0 2,2

2,2

Kombinationsfaktor

Tabelle 6: Kombinationen von Aktivitätengruppen

Tabelle 6 zeigt, dass Beiträge, die Schlagwörter aus den Gruppen Analysieren oder Interpretieren haben, in geringerem Maße mit Schlagwörtern aus anderen Gruppen kombiniert werden. sind als ausgehend von den übrigen Gruppen. Die höchsten Kombinationswerte werden erreicht für Interpretieren-Analysieren (58 %), Aufbewahren-Veröffentlichen (57 %), Erfassen-Analysieren (52 %), Erzeugen-Analysieren (52%) und Anreichern-Analysieren (52%).

Auch für die Topics im Einzelnen lässt sich fragen: Welche Topics stehen über ihr gemeinsames Vorkommen bei den Beiträgen in Beziehung zueinander?

Abbildung 14: Netzwerk der Topics, die bei Einreichungen zusammen vergeben wurden

Topics, die bei den Einreichungen zusammen vergeben wurden, sind in Abb. 14 als Netzwerk visualisiert (erstellt mit D3). Jeder Knoten repräsentiert ein Topic. Die Größe der Knoten spiegelt die Häufigkeit der Vergabe des Topics wider, die Farbe der Knoten bildet die Zugehörigkeit zur Oberkategorie in TaDiRAH ab (Objekte: blau, Aktivitäten: gelb-orange-grün). Die Dicke der Verbindungen zwischen den Knoten zeigen an, wie häufig die Topics gemeinsam vergeben wurden. Verbindungen, die häufiger als fünfmal vorkommen, sind rot eingefärbt. Die Gestalt des Netzwerks zeigt, dass die Topics untereinander auf vielfältige Weise verbunden sind. Die stärkste Verbindung besteht mit 19 Vorkommen zwischen “Annotieren” und “Text”, gefolgt von “Annotieren” und “Modellierung” mit 16 Vorkommen. Die folgende Tabelle zeigt die Top Neun der gemeinsam vorkommenden Topics (den zehnten Platz teilen sich sieben Kombinationen mit je elf Vorkommen, die hier nicht mehr aufgenommen sind):

Häufigkeit Topics 19 Annotieren – Text 16 Annotieren – Modellierung 15 Inhaltsanalyse – Text 15 Modellierung – Theoretisierung 15 Modellierung – Text 14 Annotieren – Inhaltsanalyse 13 Inhaltsanalyse – Modellierung 12 Inhaltsanalyse – Literatur 12 Methoden – Text

Tabelle 7: Häufigkeiten von Topic-Kombinationen

Fazit

Abschließend bleibt festzuhalten, dass unsere Auswertung der Daten zu den DHd2018-Einreichungen einen eher explorativen Charakter hat. Dabei hat sich gezeigt, dass es einen gewissen Widerspruch zwischen vielleicht naheliegenden Fragestellungen und den verfügbaren Daten gibt. In vielen Fällen lassen sich Fragen zur Struktur und Entwicklung der Digital Humanities mit den vorliegenden Informationen kaum beantworten. Auf der anderen Seite führen manche Daten auch nicht zu klaren Bildern, aus denen sich Aussagen ableiten lassen würden.

Dies liegt auch daran, dass die Daten im Conftool ganz bestimmte Funktionen (nämlich eine Tagung zu organisieren) erfüllen und nicht danach organisiert sind, ausgewertet zu werden. Ein Beispiel dafür sind die Anredeformen: Sie haben vor allem die Funktion, in Serienbriefen eingesetzt werden zu können – eine belastbare Untersuchung der Geschlechterverteilung wird dadurch leider nicht ermöglicht.

Prinzipiell denkbar wäre es auch gewesen, Text-Mining-Methoden auf die Abstracts anzuwenden, um z. B. Themen genauer zu untersuchen. Jedoch stehen auch dafür keine geeigneten Daten zur Verfügung, weil die Kurzabstracts im Conftool nicht immer vorhanden sind oder sehr unterschiedliche Längen haben. Auch hier ist zu konstatieren, dass es kein einheitliches Verständnis von der Verwendung des Feldes “Kurzabstract” bei den Einreichenden gegeben hat. Hier könnte bei den kommenden Tagungen vielleicht für mehr Klarheit gesorgt werden.

Interessant in Bezug auf den Stand und die Entwicklung des Feldes “Digital Humanities” werden solche Auswertungen eigentlich erst durch den Vergleich mit Auswertungen zu anderen Tagungen oder für dieselbe Tagung über die Zeit. Wir hoffen, einen weiteren Baustein dafür geliefert zu haben.

[1] Die Orte als Orte der angegebenen Affiliationen sind nicht ganz einfach zu ermitteln. Wir haben dazu eine Positivliste erstellt, mussten dabei aber auch etliche Institutionsangaben berücksichtigen, die gar keinen Ort enthielten – … liebe Wiener … . [2] Die Visualisierung basiert auf einer Vorlage von Mike Bostock, bei der die Bibliothek D3 eingesetzt wurde.

Ausschreibung zum Berliner DH-Preis 2018 ist online

Mo, 02/19/2018 - 15:30

Der Berliner DH-Preis wird zum vierten Mal vergeben und wir hoffen auch dieses Jahr auf zahlreiche Bewerbungen bzw. Nominierungen herausragender Berliner Projekte auf dem Gebiet der Digital Humanities.

Zur Teilnahme berechtigt sind alle Wissenschaftlerinnen und Wissenschaftler, die in einem DH-Projekt aktiv mitwirken. NachwuchswissenschaftlerInnen, einschließlich Bachelor-, Master und Promotionsstudierende, werden besonders ermutigt, sich zu bewerben. Bedingung ist, dass das Projekt (mit mindestens einem Principal Investigator/einer Projektleitung) an einer Berliner Forschungseinrichtung, Gedächtnis- oder Kulturinstitution angesiedelt ist.

Die Preisverleihung, zu der wir Sie bereits heute herzlich einladen, findet am 26. Juni 2018 im Rahmen einer Festveranstaltung an der BBAW (Berlin-Brandenburgische Akademie der Wissenschaften) statt.
Alle weiteren Informationen zur Jury, Teilnahmebedingungen, Fristen und Terminen finden Sie unter http://www.ifdhberlin.de/dh-preis/.

CFP: Scientia Poetica. Jahrbuch für Geschichte der Literatur und Wissenschaften / Yearbook for the History of Literature, Humanities, and Sciences

So, 02/18/2018 - 13:13

Call for Papers:

Scientia Poetica. Jahrbuch für Geschichte der Literatur und Wissenschaften

Hrsg. v. Andrea Albrecht, Lutz Danneberg, Gerhard Regn, Wilhelm Schmidt-Biggemann, Friedrich Vollhardt (bis 2012 Horst Thomé†; bis 2016 Andreas Kablitz)

Das Jahrbuch Scientia Poetica erscheint seit 1997 und hat die Aufgabe, Literatur- und Wissenschaftsgeschichte aufeinander zu beziehen. Es reagiert damit auf die Erweiterungen der Fragestellungen und Methoden, die sich in den letzten Jahrzehnten in beiden Disziplinen herausgebildet haben und möchte sich daher auch explizit für Beiträge aus den digital humanities öffnen. Aus der Erkenntnis heraus, dass der literarisch-künstlerische, der geisteswissenschaftliche und der naturwissenschaftliche Diskurs keine streng getrennten Sphären sind, die losgelöst voneinander angemessen beschrieben werden können, bietet das Jahrbuch ein interdisziplinäres Forum für die historische Analyse der Wechselwirkungen zwischen den (Natur-)Wissenschaften und der Literatur(-Wissenschaft) in den Theoriebildungs- und Reflexionsprozessen vom hohen Mittelalter bis zur Gegenwart. Zum Gegenstandsbereich des Jahrbuchs gehört der Kanon der Wissenschaften, den die mittelalterliche Universität begründet hat und der in neuerer Zeit um Disziplinen wie die Naturwissenschaften, die Psychologie, Soziologie oder Geschichtswissenschaft erweitert wurde. Dabei wird bewusst auf eine thematische Begrenzung der vielfältigen Zeiten, Disziplinen und Aspekte verzichtet.

Wir bitten um die Zusendung von Beiträgen und Rezensionen für das aktuelle Jahrbuch bis Mitte Juni 2018 an Marcus Willand: scientia-poetica@gs.uni-heidelberg.de.

Das Jahrbuch ist eine begutachtete Publikation; sie erscheint im Verlag Walter de Gruyter. Beiträge erscheinen auf Deutsch und auf Englisch. Weitere Informationen für Autorinnen und Autoren finden Sie auf der Website des Jahrbuchs: http://www.uni-stuttgart.de/ilwndl/forschung/ht/scientiapoetica/index.html

+++++++++++++++

Call for Papers:

Scientia Poetica. Yearbook for the History of Literature, Humanities, and Sciences

Editors: Andrea Albrecht, Lutz Danneberg, Gerhard Regn, Wilhelm Schmidt-Biggemann, Friedrich Vollhardt (until 2012 Horst Thomé†; until 2016 Andreas Kablitz)

Scientia Poetica is a peer reviewed journal that appears annually since 1997. Its focus is the relation between the history of literature and the history of science, motivated by the emergence of new questions and methods that both disciplines have seen in the last two decades. Therefore we explicitly welcome contributions from the digital humanities. Realizing that the discourses of the arts and literature, the humanities, and the sciences are not strictly separated spheres that could be described appropriately without reference to each other, the journal offers an interdisciplinary forum for the historic analysis of the interactions between the sciences and the humanities in the development and reflection of their theoretical concepts from the High Middle Ages to present times. The scope of the journal encompasses the canon of sciences that was the foundation of the medieval university and saw in recent times the addition of new disciplines such as the natural sciences, psychology, sociology, or the historical sciences. No further restriction is imposed on the time, the topics, or the disciplines under consideration.

We invite submissions for the current issue which are to be sent by mid June 2018 to Marcus Willand: scientia-poetica@gs.uni-heidelberg.de.
The journal is peer reviewed. It is published by Walter de Gruyter. Contributions appear in German or English.

Further information for authors can be found on the journal’s website: http://www.uni-stuttgart.de/ilwndl/forschung/ht/scientiapoetica/index.html

Stellenausschreibung E13 Berlin, BBAW, TELOTA

Di, 02/13/2018 - 17:37
Die Berlin-Brandenburgische Akademie der Wissenschaften sucht für ihre Initiative TELOTA zum nächstmöglichen Zeitpunkt eine/einen Wissenschaftliche/n Mitarbeiter/in in Vollzeit (100 %) mit Erfahrungen in den Digital Humanities und im Bereich Forschungsdatenmanagement (zunächst befristet auf 2 Jahre, ggf. teilbar). Es erwartet Sie ein nettes, junges Team, interessante und vielfältige Aufgabengebiete und ein Arbeitsplatz an einem der schönsten Plätze Europas inmitten des Zentrums Berlins. Den kompletten Ausschreibungstext finden Sie hier verlinkt.

DARIAH-DE – Forschen mit digitalen Diensten und Werkzeugen für alle Geistes- und Kulturwissenschaftler

Di, 02/13/2018 - 16:35
Einstieg

Im Zuge der Digitalisierung von Wirtschaft, Gesellschaft und Wissenschaft gewinnen auch die Digital Humanities zunehmend an Bedeutung. Die stark anwachsende Verfügbarkeit digitaler Daten für die Forschung trägt dazu bei, das Interesse an den Methoden und Werkzeugen dieser vergleichsweise jungen Disziplin zu wecken.

EinsteigerInnen in die Digital Humanities stellen sich häufig die Fragen: Was sind die Digital Humanities, welche Forschungsfragen lassen sich mit den Mitteln der Digital Humanities bearbeiten, welche Werkzeuge sind für bestimmte Fragestellungen in unterschiedlichen Fachdisziplinen geeignet, wie ist mit digitalen Forschungsdaten zu verfahren im Hinblick auf Ihre Aufbereitung, Speicherung, Veröffentlichung, Zitierbarkeit und Nachnutzbarkeit?

Die digitalen Geisteswissenschaften lassen sich an der Schnittstelle zwischen Informatik und Geisteswissenschaften verorten. Das Selbstverständnis kann dabei zwischen den beiden Endpolen variieren und entsprechend aufgefasst werden – als unterstützendes Angebot und Erweiterung oder als eigenständige Disziplin mit einem ganz eigenen theoretischen und methodischen Ansatz. Auch die fachliche Zuordnung erweist sich als variabel. So gibt es Universitäten, in denen die Digital Humanities der Informatik und solche, wo sie den geisteswissenschaftlichen Fächern zugeordnet sind. Sieht man von der noch nicht abgeschlossenen Definitionsdebatte ab, so können die Digital Humanities in einer Minimalbeschreibung als Sammelbezeichnung für computergestützte Verfahren und Methoden aufgefasst werden, die im Zuge der digitalen Transformation der Geistes- und Kulturwissenschaften Einzug in die wissenschaftliche Praxis halten. Bereits in der Vergangenheit formulierte Forschungsfragen lassen sich mit neuen Verfahren bearbeiten, aber auch neue Fragestellungen, Konzepte und Ansätze ergeben sich aus den Möglichkeiten computergestützter Analyse großer Datenmengen bis hin zu neuen Formen der Visualisierung und Publikation von Forschungsergebnissen. Entsprechend vielfältig sind auch die Arbeitsfelder und Verfahren.1

DARIAH-DE, als digitale Forschungsinfrastruktur, bietet eine Vielzahl von Diensten und Werkzeugen an, die Forschende aus den Geistes- und Kulturwissenschaften nutzen, auch wenn sie nicht ihren Schwerpunkt in den digitalen Geisteswissenschaften haben oder bisher kaum mit den Digital Humanities befasst waren.

Die von DARIAH-DE angebotenen Dienste und Werkzeuge können zur Unterstützung von Forschungsprozessen eingesetzt werden und ermöglichen zudem die Präsentation, Aufbereitung, Speicherung, Publikation und Verbreitung von Forschungsergebnissen. Mit DARIAH-DE stehen viele Möglichkeiten offen, mit eigenen und von Kolleginnen und Kollegen bereitgestellten Forschungsdaten zu arbeiten. Alle digitalen Werkzeuge und Dienste werden in Zusammenarbeit mit Wissenschaftlerinnen und Wissenschaftlern unterschiedlichster geistes- und kulturwissenschaftlicher Disziplinen erarbeitet und weiterentwickelt. DARIAH-DE versammelt hierzu eine breit gefächerte Expertise: Partner mit unterschiedlichsten geisteswissenschaftlichen und technischen Hintergrund aus Bibliotheken, Universitäten, Akademien der Wissenschaften, Rechenzentren, außeruniversitären Forschungseinrichtungen und technischen Dienstleistern arbeiten eng zusammen. Die Infrastruktur fördert den Austausch von Methoden, Ressourcen, Daten und Erfahrungen und bietet hierzu vielfältige Schulungs- und Serviceangebote. Durch die Einbindung in DARIAH-EU wird zudem auf europäischer Ebene der interdisziplinäre Austausch von Wissen und Expertise gefördert.

Die Wahl der Dienste ist abhängig vom fachwissenschaftlichen Hintergrund und der Forschungsfrage. Darüber hinaus gibt es Dienste, die im Zuge der zunehmenden Verfügbarkeit und Verbreitung von digitalen Forschungsdaten für alle Forschenden von Interesse sind, da sie den Zugang und die Suche nach Forschungsdaten sowie deren Aufbereitung und Veröffentlichung betreffen. Diese Dienste sind in der Forschungsdaten-Föderationsarchitektur von DARIAH-DE zusammengefasst und werden daher im Folgenden eingehender vorgestellt, gefolgt von einem Kurzüberblick über weitere DARIAH-DE-Dienste.

DARIAH-DE Forschungsdaten-Föderationsarchitektur

Die DARIAH-DE Forschungsdaten-Föderationsarchitektur (DFA) versammelt verschiedene Dienste und Anwendungen, um ein möglichst komfortables Forschungsdatenmanagement zu ermöglichen. Sie besteht aus dem DARIAH-DE Repository, der Collection Registry, dem Data Modeling Environment und der Generischen Suche. All diese Komponenten sind miteinander modular verknüpft und decken den Bedarf von Forschenden zur Verwaltung, Speicherung, Beschreibung, Veröffentlichung, Referenzierung und Recherche von Forschungsdaten2ab. Der modulare Aufbau der DFA ermöglicht es Forschenden, je nach Bedarf, nur einzelne Bereiche oder alle Komponenten zu nutzen. User Guides und How-to articles stehen den Forschenden im öffentlichen DARIAH-DE Wiki unterstützend zur Verfügung.

DARIAH-DE Repository

Im DARIAH-DE Repository können Forschende Ihre Daten langfristig, sicher und nachhaltig speichern und veröffentlichen.3 Als Einstiegspunkt in das digitale Langzeitarchiv für geistes- und kulturwissenschaftliche Forschungsdaten bietet DARIAH-DE mit dem Publikator Forschenden eine benutzerfreundliche Weboberfläche zum Einspielen von Daten.4

Über die Weboberfläche legen sie zunächst eine Kollektion an, die als übergeordnete Einheit der Aggregation ihrer Forschungsdaten dient und es ihnen erlaubt, ihre Daten zu einem Thema zusammenzufassen sowie als eine Sammlung zusammengehöriger Objekte zu beschreiben. Zur Beschreibung ihrer Kollektion, als auch ihrer hochgeladenen Dateien, steht den Forschenden Dublin Core Simple als Metadatenstandard zur Verfügung. Mit wenigen Pflichtangaben können sie ihre Daten für eine Veröffentlichung vorbereiten. Bis dahin werden ihre Daten in ihrem eigenen Speicherbereich, dem OwnStorage, sicher gespeichert. Sobald sie ihre Daten dann veröffentlichen, erhalten diese einen eindeutigen und dauerhaften digitalen Identifikator (DOI – Digital Object Identifier). Diese Persistenten Identifikatoren können sie zur Referenzierung ihrer Kollektion als Ganzes und jedes einzelnen darin enthaltenen Objekts nutzen. Über diese Referenzierung sind die veröffentlichten Daten dauerhaft zitierbar und öffentlich zugänglich.

Collection Registry

Wenn die Forschenden die Sichtbarkeit ihrer Daten weiter erhöhen, die Beschreibung der Daten ausführlicher und damit für die Wissenschaftscommunity zugänglicher gestalten wollen, bietet DARIAH-DE ihnen mit der Collection Registry eine weitergehende, benutzerfreundliche Möglichkeit an. Durch die Registrierung und erweiterte Beschreibung ihrer Kollektionen sind diese nun nicht nur über Persistente Identifikatoren (DOIs) referenzierbar, sondern sind zusätzlich über die Generische Suche von DARIAH-DE recherchierbar.

Hierbei lassen sich aber nicht nur im DARIAH-DE Repository veröffentlichte und mit DOIs versehene Daten verzeichnen, sondern auch Daten die bereits an anderer Stelle veröffentlicht oder gesichert sind, auch wenn sie nicht in digitaler Form vorliegen. Denn in der Registry werden nicht die Daten selbst, sondern nur Beschreibungen (Metadaten) und Referenzen auf die Daten gespeichert sowie Angaben zur Zugriffsmethode verzeichnet. Über die Generische Suche stehen diese Beschreibungen – öffentlich zugänglich – anderen Forschenden zur Recherche zur Verfügung.

Für bereits im DARIAH-DE Repository veröffentlichte Daten wird mit der Veröffentlichung zeitgleich auch ein Entwurf einer Kollektionsbeschreibung in der Collection Registry angelegt, den Forschende anschließend erweitern und veröffentlichen können. Hierfür steht ein umfangreiches über Dublin Core Simple hinausgehendes Beschreibungsschema mit entsprechenden Eingabefeldern zur Verfügung, das DARIAH Collection Description Data Model –DCDDM.

Generische Suche

Mit der Entwicklung der Generischen Suche verfolgt DARIAH-DE das Ziel, den Geistes- und Kulturwissenschaften und ihren Forschenden ein Recherchewerkzeug zur Verfügung zu stellen, welches sie an die eigenen Bedürfnisse anpassen können.

Die Generische Suche speist sich aus unterschiedlichen Quellen und ermöglicht eine themenübergreifende Recherche. Sie ist ohne Anmeldung verwendbar und bietet vielfältige Anpassungsoptionen.  Nutzer können die Quellen für die Suche auswählen und mit der Funktion „myCollections“ sich auch eine individuelle Auswahl an Sammlungen zusammenstellen, um nur bestimmte präzise definierte Metadatensätze der Collection Registry zu durchsuchen. Diese Zusammenstellung können sie zusätzlich mit anderen Forschenden teilen. Die angebotenen Anpassungen erlauben ihnen insgesamt durch eine Kombination aus Tiefen- und Breitensuche die Granularität der eigenen Suche dynamisch zu variieren. Auch Sammlungen mit unterschiedlichen Beschreibungsschemata lassen sich nach einer Zuordnung der zugrundeliegenden Elemente verknüpfen und werden gemeinsam durchsuchbar. Hierfür steht eine weitere modulare Komponente der DARIAH-DE Datenföderationsarchitektur zur Verfügung, das Data Modeling Environment.

Data Modeling Environment

Innerhalb des Data Modeling Environment (DME) können Datenmodelle und Verbindungen zwischen ihnen beschrieben werden. Häufige Anwendungsfälle sind, dass Daten zwischen unterschiedlichen Metadatenstandards ausgetauscht werden sollen und Daten aufbereitet werden, um sie in neue Strukturen zu integrieren oder in bestimmten Werkzeugen sowie Diensten nutzen zu können. Auch die Erweiterung der Beschreibung der Daten, um Hintergrund- und Expertenwissen zu einer Datensammlung explizit und nachvollziehbar zu gestalten, ist ein möglicher Anwendungsfall.

Das DME bietet für die Datenbeschreibung und -strukturierung eine webbasierte Anwendung, in der bereits vorhandene Datenmodelle zur Beschreibung ausgewählt, eigene angelegt oder hochgeladen werden können, um die einzelnen Beschreibungselemente miteinander zu korrelieren.

DARIAH-DE Dienste im Überblick Kollaboratives Arbeiten und Projektmanagement  Dienste Kurzbeschreibung: Wozu dienen die Dienste / Werkzeuge Cloudshare … ermöglicht Dateien auf einem Server per Browser oder einem Klienten zu speichern, mit anderen Forschenden zu teilen oder auf andere Geräte zu überragen sowie ortsunabhängig zu synchronisieren. Etherpad … ist ein webbasierter Editor zur kollaborativen, standortunabhängigen Texterstellung, der sowohl den Import bereits bestehender Dateien als auch den Export in verschiedene Formate erlaubt. OpenProjects … ist ein webbasiertes kollaboratives Projektmanagementsystem. Es ermöglicht die Unterstützung des kompletten Projektlebenszyklus. Wiki … bietet eine kollaborative Informationsplattform, auf der Forschende zum Beispiel im Rahmen von Projekten, Informationen, Ergebnisse und Daten standortunabhängig einspeisen, bearbeiten und austauschen können.  Ein Rechte- und Zugriffsmanagement erlaubt es, eigene interne sowie öffentlich zugängliche Bereiche einzurichten. Forschungsdaten und Forschungsdatenmanagement  Dienste Kurzbeschreibung: Wozu dienen die Dienste / Werkzeuge Collection Registry …stellt einen Katalog von Sammlungen mit ihren Beschreibungen dar, in dem Kollektionen beschrieben und Metadaten und Zugriffsmöglichkeiten verzeichnet werden können und somit über die Generische Suche von DARIAH-DE öffentlich zugänglich recherchierbar werden. ConedaKOR … verwaltet und präsentiert akademische Objektsammlungen aus den bildbasierten Kultur- und Geisteswissenschaften. Data Modeling Environment … dient der Modellierung und Assoziation von Daten und Metadaten. DARIAH-DE Repository …. ermöglicht als digitales Langzeitarchiv für geistes- und kulturwissenschaftliche Forschungsdaten, Forschungsdaten nachhaltig und sicher zu speichern, sie mit Metadaten zu versehen und referenzierbar zu veröffentlichen sowie zusätzlich durch die Generische Suche aufzufinden. Generische Suche … bietet eine übergreifende Suchmöglichkeit im Katalog der wissenschaftlichen Sammlungen, die eine Kombination von Breiten- und Tiefensuche in über 3 Millionen in der DARIAH-DE Collection Registry verzeichneten Dokumenten erlaubt. Publikator … dient dem Hochladen und Veröffentlichen von Daten in das DARIAH-DE Repository. TextGrid Repository … ist ein fachwissenschaftliches Langzeitarchiv und Teil der Virtuellen Forschungsumgebung TextGrid, das eine Open Source-Software für die kollaborative Erstellung und Publikation z.B. digitaler Editionen auf XML/TEI-Basis anbietet. Annotieren, Analysieren und Visualisieren  Dienste Kurzbeschreibung: Wozu dienen die Dienste / Werkzeuge CosmoTool … fasst biographische Informationen aus unterschiedlichen Quellen zu nationalen und internationalen Bewegungsprofilen historischer Persönlichkeiten zusammen. DKProWrapper … ermöglicht die Extraktion von linguistischen Informationen aus Texten zur maschinellen Verarbeitung natürlicher Sprachen. Geo-Browser … analysiert als webbasiertes Werkzeug Raum-Zeit-Relationen von Daten und Quellensammlungen und ermöglicht Ihre visuelle Darstellung, vor dem geographischen Hintergrund einer Auswahl historischer Karten. Digivoy …. ermöglicht  vielseitige explorative und analytische Zugänge zu beliebigen Texten oder Textsammlungen und stellt hierfür mehrere webbasierte „Voyant Tools“ zur Verfügung. Durch die Anbindung an TextGrids Digitaler Bibliothek stehen vorab schon Werke von 600 deutschsprachigen Autoren hierfür zur Verfügung. SemToNotes … dient der Untersuchung von räumlich-topologischen Beziehungen zwischen semantisch aufgeladenen Teilflächen eines Bildes, ist ein Annotations- und Retrievalwerkzeug zur Untersuchung der räumlichen Komposition eines Bildes. Topics … ist auf die Bedürfnisse der Literaturwissenschaft zugeschnitten und bietet eine Python-Bibliothek für Topic Modeling. Webapp Orte jüdischer Geschichte … ist eine stetig funktional und inhaltlich erweiterte Web-App, die insbesondere ortsbezogene Informationen u.a. zur jüdischen Geschichte enthält. Edieren  Dienste Kurzbeschreibung: Wozu dienen die Dienste / Werkzeuge MEI Score Editor … zeigt als Desktop-Tool MEI-kodierten Musikdateien an und ermöglicht ihre Bearbeitung. Es bedient Forschungsfragen in der Musikologie. TextGrid Laboratory … ist eine virtuelle Forschungsumgebung für die Geisteswissenschaften, die vielfältige Open-Source-Werkzeuge und -Services zur Unterstützung des gesamten Forschungsprozesses, insbesondere bei der Erstellung digitaler Editionen bietet. Community, Support, Schulungsmaterialien

DARIAH-DE ist nicht nur eine digitale Forschungsinfrastruktur, sondern auch eine soziale Infrastruktur, die den Community-Austausch und ihre Vernetzung über diverse Schulungs-/Lehrmaterialien, Beratungsangebote sowie über Veranstaltungen befördert.

DARIAH-DE entwickelt sein Informationsangebot beständig weiter und vermittelt es multimedial.  Neben dem DHd-Blog, der über aktuelle Themen und Entwicklungen informiert, versammelt der DHd-Kanal auf YouTube Clips rund um die Themen Digital Humanities im deutschsprachigen Raum. Dort finden sich auch vielfältige Videos rund um die Aktivitäten der Forschungsverbünde TextGrid und DARIAH-DE, zu Veranstaltungen, Tutorials und insbesondere zu den Themen virtuelle Forschungsumgebungen, Forschungsdatenmanagement und digitales Edieren.

Mit der Bibliographie Doing Digital Humanities stellt DARIAH-DE Forschenden, Studierenden und Interessierten eine Auswahl an Einführungswerken sowie weiterführende Literatur zu diversen Themenfeldern der digitalen Geistes- und Kulturwissenschaften zur Verfügung.

Das als „Living Book“ konzipierte Handbuch Digital Humanities bietet einen erste Einführung in die Thematik. Es ist im Rahmen eines dreitägigen Book Sprints von DARIAH-DE entstanden, der 2015 in der Open Knowledge Foundation in Berlin stattfand. Das Besondere in diesem Zusammenhang stellt die Nähe zur fachwissenschaftlichen Praxis dar und dass es in den weiteren Fassungen ergänzt wird. Der Leser findet hier Projekte und Werkzeuge detailliert vorgestellt, kann seine Kenntnisse auffrischen und neue Aspekte kennenlernen, zudem werden Lösungsvorschläge für typische Fragen formuliert.

In der nun mehr siebenjährigen Tätigkeit des Forschungsverbundes sind Publikationen und Präsentationen rund um DARIAH-DE entstanden, die Einblicke in vielfältige Themen gewähren.

Wer gerne auf dem Laufenden blieben möchte, sei auf die Tweets von @DARIAHde verwiesen.

Gerne stehen wir Ihnen über info@de.dariah.eu für Rückfragen oder Anfragen zur Verfügung!

 

 

  1. Vgl. hierzu die Erörterung zur Eingrenzung der Digital Humanities sowie den Überblick zu ihren Themenfeldern und Arbeitsmethoden in: Fotis Jannidis, Hubertus Kohle und Malte Rehbein (Hrsg.), Digital Humanities – Eine Einführung, Stuttgart: J.B. Metzler Verlag, 2017
  2. Für Informationen zum Begriff „Forschungsdaten“ und dem „Research Data Life Cycle“ im Kontext von DARIAH-DE siehe https://de.dariah.eu/weiterfuhrende-informationen
  3. Das DARIAH-DE Repository ist am 06.12.2017 offiziell als Langzeitarchiv für geistes- und kulturwissenschaftliche Forschungsdaten gestartet. Das Humanites Data Center (HDC) stellt als Kooperation der Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG) und der Niedersächsischen Staats- und Universitätsbibliothek Göttingen (SUB) den langfristigen Betrieb des Repositorys sicher: https://www.uni-goettingen.de/de/3240.html?tid=604
  4. Ein erster Erfahrungsbericht zur Veröffentlichug von eigenen Forschungsdaten findet sich bereits hier im DHd-Blog: http://dhd-blog.org/?p=8798

Ankündigung: Workshop „Measuring Change in Digital Humanities: Workshop on Impact Factors and Success Criteria“

Mo, 02/12/2018 - 12:38

Die DARIAH-EU Working Group Impact factors and success criteria lädt ein zum Diskutieren über Erfolgskriterien von DH-Forschungsinfrastrukturen. Der Workshop findet statt am 21. und 22. Juni am Institut für Bibliotheks- und Informationswissenschaften der Humboldt-Universität zu Berlin.

Die komplette Ankündigung (auf Englisch) können Sie auf der Seite des Instituts lesen.

Die Anmeldung ist freigeschaltet.

2 Stud. Hilfskräfte „Digitale Sammlung Deutscher Kolonialismus“ (BBAW, Berlin) gesucht

Mo, 02/12/2018 - 09:09

Die Berlin-Brandenburgische Akademie der Wissenschaften (BBAW) sucht für das von der DFG geförderte Projekt Digitale Sammlung Deutscher Kolonialismus zum 1. März 2018, zunächst befristet bis zum 30.09.2018

zwei studentische Hilfskräfte (je 41h/Monat).

Ziele des Vorhabens sind die Digitalisierung, elektronische Erschließung und Online-Präsentation der Quellen zur deutschen Kolonialgeschichte in einer virtuellen Digitalen Sammlung Deutscher Kolonialismus, die sich aus Beständen der SuUB Bremen und der UB Frankfurt zusammensetzt. Die zukünftige Digitale Sammlung Deutscher Kolonialismus möchte die systematische, interdisziplinäre Erforschung historischer, kultureller und kommunikations- und wissenschaftsgeschichtlicher Implikationen des deutschen Kolonialismus unter Berücksichtigung postkolonialer Folgen unterstützen. Integriert werden über 1.000 Titel zu unterschiedlichen Fachgebieten mit insgesamt ca. 245.000 Seiten. Die Titel wurden zwischen 1884 und 1919 publiziert und entstammen der historischen Kernzeit des deutschen Kolonialismus.
Es werden studentische Hilfskräfte mit einem informations- und geisteswissenschaftlichen Profil gesucht.
Aufgaben:
– Konvertierung bzw. Transformation von XML-kodierten Daten,
– Strukturierung von Werken anhand der Bilddigitalisate,
– Unterstützung bei der Qualitätssicherung (Identifikation und Korrektur von Erfassungs-, Auszeichnungs-, Druck- und anderen Fehlern),
– Kontrolle und ggf. Korrektur von bibliographischen Metadaten und
– ggf., je nach Vorkenntnissen, Korrektur und Anreicherung von TEI-XML-kodierten Volltexten.
Voraussetzungen:
– Erfahrungen im Umgang mit der Skriptsprache Python und X-Technologien,
– Akribische, selbstständige Arbeitsweise sowie grundsätzliche Vertrautheit mit der Typographie und den wesentlichen Strukturelementen historischer Drucke und
– Begeisterung für und Interesse an der Arbeit mit historischen Dokumenten in Verbindung mit dem Computer.
– Wünschenswert sind Kenntnisse der Richtlinien der Text Encoding Initiative (TEI) sowie Erfahrung mit der digitalen Bildbearbeitung.

Die Vergütung erfolgt nach TV Stud Berlin. Bewerbungen von Frauen sowie von Bewerbe-rinnen und Bewerbern mit Migrationshintergrund sind ausdrücklich erwünscht. Bewerbungen von Schwerbehinderten werden bei gleicher Eignung vorrangig berücksichtigt.

Ihre aussagekräftigen Bewerbungsunterlagen richten Sie bitte bis zum 18.02.2018 möglichst elektronisch in einer pdf-Datei unter der Kennziffer IAG 01/2018 an:
Berlin-Brandenburgische Akademie der Wissenschaften
Digitale Sammlung Deutscher Kolonialismus
Christian Thomas
Jägerstraße 22/23, 10117 Berlin
thomas@bbaw.de

Kontakt

Christian Thomas
Berlin-Brandenburgische Akademie der Wissenschaften (BBAW)
thomas@bbaw.de

Stellungnahme der Gesellschaft für Musikforschung zum NFDI-Prozess

Fr, 02/09/2018 - 16:21

Der Vorstand der Gesellschaft für Musikforschung (GfM) hat auf der Gesellschafts-Website ein Memorandum des Verbands zur Schaffung nationaler Forschungsdateninfrastrukturen (NFDI) veröffentlicht und ist darin der Aufforderung des Rats für Informationsinfrastrukturen gefolgt, sich in die Diskussion um diese für alle Fachgebiete wichtige Weichenstellung einzubringen. Die Stellungnahme, die – wie zuvor schon jene des Historikerverbands – auf die spezifischen Gegebenheiten kulturwissenschaftlicher Gegenstände und Forschung hinweist, hebt die Bedeutung spezialisierter, fachnaher Lösungen für die Effizienz des zu bildenden Netzwerks hervor und begrüßt die auch in der Stellungsnahme des DHd angeregte breite Diskussion über die Leitvorstellungen einer solchen Infrastruktur. Der Text der GfM ist in einer Kurz- und einer Langversion verfügbar unter: https://www.musikforschung.de/index.php/memoranda/schaffung-nationaler-forschungsdateninfrastrukturen-nfdi

Die Serviceinfrastruktur von DARIAH auf einen Blick – die DESIR Gap Analysis

Di, 02/06/2018 - 10:15

Welche Dienste und Werkzeuge stellt DARIAH der Digital Humanities Community zur Verfügung? Wo können Forschende Werkzeuge und Dienste finden? Diese ganz wesentliche Anforderung kann derzeit noch nicht ausreichend bedient werden, bis zum Launch des DARIAH Open Marketplace in naher Zukunft, der dann als zentrale Informationsplattform dienen wird.

Im Rahmen von DESIR (DARIAH ERIC Sustainability Refined) wurde die Frage der Werkzeuge- und Diensteübersicht aus einer anderen Perspektive betrachtet. Gibt es Lücken in der DARIAH-Servicelandschaft, sind mögliche Erweiterungen oder bestimmte Nutzungsanforderungen bisher unberücksichtigt geblieben, die im Rahmen von DESIR in Angriff genommen werden können?

Zu diesem Zweck und zur Erleichterung des Entscheidungsprozesses für spezifische (neue) Service-Demonstratoren und -Konzepte wurde eine Übersicht der DARIAH-Forschungsinfrastruktur durchgeführt und auf HAL als Open Access veröffentlicht: https://halshs.archives-ouvertes.fr/hal-01663594

Der Bericht wurde im Hinblick auf die vier DESIR-Technologiebereiche (entity-based search, scholarly content management, text analysis services und visualisation) erstellt. Einige Ergebnisse des Berichts:

  • Es gibt ein großes Repertoire von Diensten, Werkzeugen und anderen Ressourcen. In vielen Fällen ist es jedoch schwierig, diese eindeutig mit DARIAH in Verbindung zu bringen.
  • Nicht immer ist erkennbar, ob der betreffende Dienst noch aktiv ist und nach wie vor gewartet und/oder weiterentwickelt wird. Allerdings muss der wissenschaftliche Charakter der DARIAH-Forschungsinfrastruktur und ihr noch andauernder und zeitaufwendiger Institutionalisierungsprozess in Rechnung gestellt werden. Das heißt, nicht alle Werkzeuge und Dienste sind für den produktiven Betrieb vorgesehen.
  • Für den Bericht wurden insgesamt 82 Dienste ausgewählt, die derzeit aktiv einsetzbar sind.
  • Die 82 Dienste wurden in 110 Kategorien wie virtuelle Forschungsumgebung, Visualisierung, Content, Repository, NLP-Werkzeug etc. klassifiziert. Dies ermöglichte schließlich eine Clusterbildung der Dienste gemäß den DESIR-Anforderungen.
  • Eine große Anzahl von Diensten (27) stellt Inhalte oder Daten bereit; 15 Dienste bieten die Möglichkeit zur Datenanalyse oder Datenbanken; 12 Dienste können als Repository (Publikationen und Forschungsdaten) angesehen werden und 13 Dienste können als virtuelle Forschungsumgebung klassifiziert werden.
  • Zweifelsohne ist DARIAH eine wissenschaftlich orientierte Infrastruktur: Eine große Mehrheit der 82 Dienste (nämlich 76%) verfolgen wissenschaftliche Zwecke. Die restlichen 24% entfallen auf Basisinfrastrukturen oder haben kommunikative Zwecke.
  • Offensichtliche Lücken im infrastrukturellen Sinne konnten nicht identifiziert werden, aber auch hier ist der forschungsgetriebene Charakter von DARIAH zu berücksichtigen. Das bedeutet, es wird nicht im Rahmen eines kommerziellen Geschäftsmodells eine bestimmte Nachfrage bedient, sondern es kommt im Zweifelsfall zu ad-hoc-Entwicklungen in den Forschungszusammenhängen selber. Diese Entwicklungen können dann wiederum Eingang in die o.g. Werkzeuge- und Dienstesammlung finden.

Die Ergebnisse der Analyse werden auf die Diskussion um die konzeptionellen Modelle im DESIR Arbeitspaket 4 Einfluss nehmen. Als Ergebnis ist geplant, bis zum Projektende im Frühjahr 2019 drei Demonstratoren zu entwickeln.

Seiten