Reproduzierbare Dokumente mit R


Inhalt

Bei Analysen quantitativer Daten werden Auswertungen oftmals zuerst in einem Statistikprogramm ausgeführt und Ergebnisse anschließend in eine Textverarbeitung kopiert. Teilweise werden Tabellen und Grafiken noch in einem dritten Programm (bspw. Tabellenkalkulation) formatiert und angepasst.

Dieser Prozess ist fehleranfällig und hat einige Nachteile:

  1. Durch die manuellen Bearbeitungsschritte können leicht fehlerhafte Ergebnisse produziert werden (z.B. Copy-Paste-Fehler, nachträgliches Runden, etc.).
  2. Der Prozess ist zeitaufwendig, da der Benutzer die Übertragung (teilweise mehrfach) vornehmen muss.
  3. Die einzelnen Bearbeitungsschritte sind in der Regel nicht nachvollziehbar, insbesondere bei Software mit grafischer Benutzeroberfläche ist nicht immer sichergestellt, dass das Vorgehen dokumentiert ist.
  4. Die Analyse und Auswertung sowie das Schreiben geschehen nebeneinander. Dadurch können Inkonsistenzen zwischen Text und Auswertung entstehen.

Eine mögliche Lösung für diese Probleme ist es Analyse, Aufbereitung und Auswertung in einem Dokument vorzunehmen: Man spricht dann von „reproduzierbaren“ Dokumenten oder „literate programming“. Solche Dokumente enthalten dann z.B. nicht Diagramme und Tabellen, sondern nur Syntaxen, mit denen diese erstellt werden können. In einem zweiten Schritt wird daraus ein druckbares Dokument, das die fertigen Tabellen und Grafiken enthält.

Der Workshop zeigt wie mit „knitr“ und dem Statistikprogramm R solche „dynamischen“ Dokumente in LaTeX und Markdown erstellt werden können. Neben einer allgemeinen Einführung in die Erstellung von Dokumenten, die R-Syntax und Berichtstexte zusammenführen, werden auch Tipps bei der Erstellung umfangreicher Dokumente sowie für die ansprechende Gestaltung von Tabellen und Grafiken vorgestellt.

Zielgruppe

Fortgeschrittene Bachelor- und Master-Studierende aus allen Studiengängen; eine Zulassung von Promovierenden und Mitarbeitern ist lediglich bei freien Restplätzen möglich

Leitung

Sebastian Jeworutzki

Termine

  • 09.02.2018, 10:00-14:00 Uhr, FNO 02/74

Anmeldung

RUB-Angehörige werden gebeten die RUB-E-Mail-Adress anzugeben.