"tl;dr" Too long; didn't read (?) - Große Textmengen computergestützt analysieren

Inhalt

Die Summer School beschäftigt sich mit computergestützten Verfahren, um große Mengen digitaler Texte, wie z. B. Internet-Blogs, Social Media-Einträge oder twitter Posts, zu extrahieren (Web Scraping), zu analysieren und für empirischen Forschungsprojekte und Abschlussarbeiten zu nutzen. Von korpuslinguistischen Verfahren (Frequenz- und Kollokationsanalysen) bis zu Machine Learning-Algorithmen werden methodische Ansätze aus vielfältigen Disziplinen zusammengebracht und aus der jeweils fachwissenschaftlichen Sicht diskutiert und in Hands-on Sessions in kleinen Gruppen an konkreten Fragestellungen praktisch eingeübt. Die Ergebnisse werden abschließend im Plenum präsentiert und diskutiert.

Grundkenntnisse in Python werden vorausgesetzt. Der Python-Workshop des Methodenzentrums vermittelt alle notwendigen Grundkenntnisse und kann von den Teilnehmer*innen der Summer School als Vorkurs besucht werden.

Die Anmeldung erfolgt in campus. Bitte beachten: Zur Anmeldung wird um eine kurze Skizze zum Interesse am Thema aus der Perspektive Ihres Faches gebeten.

Weitere Infos: Summer School Blog

Lehrende

Für die Summer School konnten wir zwei externe Expert*innen gewinnen, die einzelne Workshop-Tage leiten werden:

Jan Oliver Rüdiger

studierte Germanistik, Informatik und Kunstwissenschaft. Er arbeitete als IT-Consultant und Trainer/Dozent in der Erwachsenenbildung. Seit 2018 ist er wissenschaftlicher Mitarbeiter am Lehrstuhl Computergestützte Sozio- und Diskurslinguistik der Universität Siegen. Seine Forschungsschwerpunkte sind Computer- & Korpuslinguistik sowie E-Learning.

Ulrike Henny-Krahmer

hat Regionalwissenschaften Lateinamerika in Köln und Lissabon studiert. Sie war wissenschaftliche Mitarbeiterin am Cologne Center for eHumanities (CCeH) und Mitarbeiterin im Projekt „Computergestützte Literarische Gattungsstilistik“ (CLiGS) an der Universität Würzburg. Aktuell befindet sie sich in Elternzeit und arbeitet an dem Abschluss ihrer Dissertation mit dem Thema “Genres as text categories: a stylistic analysis of nineteenth century Spanish American novels (1830-1910)”, in der auch Topic Modeling zum Einsatz kommt.

Zum Auftakt am 24. August erwartet uns eine spannende Keynote von Nils Rieter (Universität zu Köln)

Nils Reiter

hat Computerlinguistik und Informatik an der Universität des Saarlandes studiert. Zur Promotion wechselte er an die Universität Heidelberg, und arbeitete in einem Kooperationsprojekt zwischen klassischer Indologie und Computerlinguistik im Sonderforschungsbereich 619 „Ritualdynamik“. Seit 2014 hat er an der Universität Stuttgart als wissenschaftlicher Koordinator und Forscher im Zentrum für Reflektierte Textanalyse (CRETA) gearbeitet. Unter diesem Dach läuft auch seit 2017 sein Mixed-Methods-Projekt QuaDramA zur quantitativen Analyse dramatischer Texte aus dem 17.-19. Jahrhundert (gemeinsam mit Dr. Marcus Willand, Universität Heidelberg). Derzeit ist er Vertretungsprofessor für Sprachliche Informationsverarbeitung an der Universität zu Köln. Seine Forschungsinteressen beziehen sich hauptsächlich auf Operationalisierungsfragen, insbesondere im Bereich der (komputationellen) Literaturwissenschaft, sowie die Verbindung quantitativer, statistischer und formaler Methoden mit hermeneutischen Verfahren.

Veranstalter

Methodenzentrum und weitere Lehreinheiten der RUB

Leitung

Frederik Elwert (CERES), Sebastian Gerhartz (Methodenzentrum), Stephanie Heimgartner (Philologie), Stefan Reiners (PSE)

Termine

  • Vortreffen 09.07.2020

    Beginn: 16:00 Uhr, Ende: 18:00 Uhr

  • 24.08.2020

  • 25.08.2020

  • 26.08.2020

  • 27.08.2020

  • 28.08.2020