CLARIN-D F-AG 3 Workshop

Datenmanagement und Korpuserstellung: Workflows und Werkzeuge


5.-6. Oktober 2017 am Hamburger Zentrum für Sprachkorpora (Hamburg, Altona)

Seit der aktuellen CLARIN-D-Förderphase ist die F-AG 3 "Linguistische Feldforschung, Ethnologie, Sprachtypologie", deren Leitung und Koordination an der Universität zu Köln verortet ist, mit dem Hamburger Zentrum für Sprachkorpora (HZSK) an der Universität Hamburg assoziiert. Ziel des gemeinsamen Kick-Off Workshops ist es, aktuelle Best Practices und Bedarfe der Communities zu eruieren und als Ergebnis festzuhalten.

Die Mittagessen sowie das Abendessen finden außerhalb des Workshops und somit auf Selbstzahlerbasis statt.


Programm

Donnerstag
12:00-13:30 Mittagessen im Vapiano, http://de.vapiano.com/de/restaurants/vapiano-hamburg-altona/
14:00 Begrüßung
14:30 Timm Lehmberg (Universität Hamburg): »Digitale Workflows im Langzeitprojekt INEL – Erfahrungsbericht und Ausblicke«
15:00 Kilu von Prince (HU Berlin): »Werkzeuge und Workflows im MelaTAMP-Projekt«
15:30 Kaffeepause
16:00 Robert Schikowski (Universität Zürich): »Wie aus zehn Korpora eines wird: das ACQDIV-Korpus«
16:30 Dagmar Jung (Universität Zürich): »Workflow der Dëne Sųłıné Language Acquisition Study«
17:00 Michael Rießler (Universität Freiburg): »Datenmanagement, Korpuserstellung, Archivierung in den Freiburger Sprachdokumentationsprojekten«
17:30 Diskussion, Vorbereitung Arbeitsgruppen
Ab 19:00 Abendessen im Alten Mädchen, http://de.altes-maedchen.com/

Freitag
9:00 Einleitung
9:30 Arbeitsgruppen
12:00 Wrap-Up
13:00-14:00 Mittagessen im Köz Urfa, http://kozurfa.de/

Ort

Hamburger Zentrum für Sprachkorpora
Max-Brauer-Allee 60
22765 Hamburg (Altona)


Fragen zu Workflows

Wir haben als Einstimmung einige Fragen zusammengetragen, die für die Bestimmung und Beschreibung von Workflows eingesetzt werden können.

Projektkontext und wissenschaftliche Zielsetzung

  • Warum wird das Korpus erstellt/aufbereitet?
  • Wie soll das Korpus (zunächst) ausgewertet werden können?

Datenseitige Voraussetzungen und technische Zielsetzung

  • Was sind die ersten Quellen; wo kommen die Daten her?
  • Aus welchen Daten (Dateiformate, ggf. Schemata/Standards/Konventionen) soll die fertige digitale Ressource bestehen; wo wollen wir mit den Daten hin?

Workflows, Werkzeuge und Management

  • Welche Zustände/Versionen beschreiben jeweils den Weg zwischen der Quelle und der fertigen digitalen Ressource für die Datentypen?
  • Welche manuelle, computergestützte und/oder automatische Übergänge bzw. Arbeitsschritte verbinden diese Zustände?
  • Welche fachspezifische (und allgemeine) Werkzeuge werden für die jeweiligen Arbeitsschritte warum eingesetzt?
  • Welche Werkzeuge/Funktionalitäten fehlen bzw. müssten projektspezifisch angepasst werden?
  • Wie werden verschiedene Datentypen und Metadaten miteinander zu einer Ressource verknüpft?
  • Wie und durch wen werden die Zustände und der Fortschritt nachgehalten/dokumentiert?
  • Wie und durch wen wird die Qualität der Arbeit überprüft und gesichert?