Veranstaltungsdetails
Mit Python durch das Textchaos – Bearbeitung von Textdaten
Inhalt
Auswertungen von Daten beschränken sich oftmals nur auf bloße Zahlenwerte, allerdings sind wichtige Informationen für Forschungsfragen ebenso oft in kategorialen Variablen, Zeit- und Adressangaben oder Freitextfeldern gespeichert. In der Regel sind Datensätze jedoch nicht für die Computerverwertung vorbereitet und bedürfen sorgfältiger vorbereitender Überarbeitung – so beispielsweise bei der Auswertung von offenen Angaben in Befragungen oder bei Onlinetextdaten aus unterschiedlichen Quellen. Enstsprechend stellt die Fähigkeit mit Textdaten umzugehen eine wertvolle Erweiterungen und Vereinfachungen auch für quantitativ angelegte Datenanalysen dar.
Im Rahmen des Workshops wird ein Überblick über die Möglichkeiten zur Textverarbeitung mit Python. Hierbei werden die folgenden Inhalte behandelt:
- Der Umgang mit String-Variablen in Datensätzen (Manipulation, Bereinigung)
- Regular Expression
- Stopword removal
- Wortzählung
- Tokenisierung
- Lemmatisierung
- Einführung in Natural Language Processing
Grundsätzlich sind geringe Vorkenntnisse in Python wünschenswert, jedoch nicht zwingend erforderlich. Es wird jedoch empfohlen den Workshop "Einführung in Python" oder ein vergleichbarers Angebot zur Vorbereitung zu besuchen.
Der Workshop gehört zum Angebot des Projekts "Data.Literacy@RUB". Nähere Informationen zu weiteren Angeboten im Bereich Data Literacy finden Sie auf der Website des Projekts (https://uni.ruhr-uni-bochum.de/de/dataliteracyrub).
Leitung
Valentin Fuchs
Termine
Freitag, 19.11.2021 13:30 bis 17:30 Uhr
Anmeldung
Bitte melden Sie sich in eCampus für die Veranstaltung an.