Workshop "Digitale Forschungsmethoden in der Romanistik" beim Forum Junge Romanistik
Stadt: Würzburg
Frist: 2016-02-20
Beginn: 2016-03-15
Ende: 2016-03-16
Im Vorfeld des Forum Junge Romanistik 2016, das an der Universität Würzburg stattfindet, wird ein Workshop zum Thema “Digitale Forschungsmethoden in der Romanistk” angeboten.
Der Workshop richtet sich insbesondere an die Teilnehmer_innen des Forum Junge Romanistik, aber auch an andere Interessierte, die an einer Qualifikationsarbeit in den Sprach- oder Literatur-/Kulturwissenschaften arbeiten und herausfinden möchten, welchen Beitrag die Verwendung digitaler Texte, Werkzeuge und Methoden für ihr Forschungsvorhaben leisten könnten. Ziel ist es, praxisorientiert in die Nutzung digital vorliegender Daten für die sprach- und literaturwissenschaftliche Forschung einzuführen, ohne dabei die größeren methodischen Zusammenhänge aus den Augen zu verlieren.
Organisatorisches
Der Workshop wird am Dienstag, den 15. März um 16:15 beginnen und am Mittwoch, den 16. März um 16:00 enden. Veranstaltungsort ist das Zentrale Seminar- und Hörsaalgebäude (Z6) auf dem Campus Hubland Süd der Universität Würzburg. Um Anmeldung per Email an die Organisatoren wird bis zum 20. Februar gebeten; bitte geben Sie dabei an, ob Sie am linguistischen oder literaturwissenschaftlichen Parallelstrang teilnehmen möchten. Kontakt für Rückfragen vorab und die Anmeldung: christof.schoech@uni-wuerzburg.de und robert.hesselbach@uni-wuerzburg.de.
Programm
Dienstag, den 15. März
16:15-16:30 Begrüßung
16:30-17:30 Parallelstränge
A: Computerphilologie: Einführung und Überblick (Christof Schöch)
B: Computerlinguistik: Das Projekt Verba Alpina (Thomas Krefeld & Stephan Lücke)
17:30-18:00 Kaffeepause
18:00-19:30: Abendvortrag von Stefan Evert (Erlangen-Nürnberg): Multivariate Ansätze zur Modellierung von Sprachvariation
Abstract zum Vortrag: siehe Ende dieser Seite
ab 20:00 Gemeinsames Abendessen
Mittwoch, den 16. März
09:00-10:30 Parallelstränge
A: Computerphilologie: Einführung in die Textanalyse mit TXM (Ulrike Henny & Christof Schöch)
B: Computerlinguistik: Korpusannotation und -analyse (Thomas Krefeld & Stephan Lücke)
10:30-11:00 Kaffeepause
11:00-12:00 Literaturverwaltung mit Zotero (Christof Schöch)
12:00-13:00 Mittagspause
13:00-14:00 Parallelstränge
A: Computerphilologie: Thematische Analyse großer Textsammlungen mit Topic Modeling (Christof Schöch)
B: Computerlinguistik 3: Programmgestützte Auswertung sprachlicher Daten (Annette Gerstenberg, FU Berlin)
14:00-14:30 Kaffeepause
14:30-16:00 Parallelstränge
A: Computerphilologie: Projektberatung (Christof Schöch)
B: Computerlinguistik: Projektberatung (Annette Gerstenberg)
16:00 Ende des Workshops
Hintergrund
Der Workshop wird gemeinsam von der Nachwuchsgruppe Computergestützte literarische Gattungsstilistik, dem Forum Junge Romanistik 2016 und der Arbeitsgruppe “Digitale Romanistik” im DRV ausgerichtet, Organisatoren vor Ort sind Christof Schöch und Robert Hesselbach. Der Workshop wird möglich durch Mittel des Bundesministeriums für Bildung und Forschung (BMBF), Förderkennzeichen FKZ 01UG1508.
Abendvortrag von Stefan Evert (Erlangen-Nürnberg): Multivariate Ansätze zur Modellierung von Sprachvariation
Multivariate Ansätze zur Modellierung von Sprachvariation
Sprachvariation – über verschiedene Zeiträume, Sprachvarietäten, Regiolekte, Soziolekte, individuelle Sprecher, Textsorten usw. hinweg – bildet einen wichtigen Forschungsgegenstand für die Korpuslinguistik, Dialektologie, historische Sprachwissenschaft, Soziolinguistik und für viele andere Disziplinen. Sie äußert sich empirisch durch erhebliche Schwankungen in den Vorkommenshäufigkeiten sprachlicher Einheiten und Strukturen sowie in anderen quantitativen Eigenschaften (z.B. durchschnittliche Satzlänge oder Type-Token-Ratio).
Oft weisen dabei Gruppen von Merkmalen ähnliche Variationsmuster auf, d.h. sie sind mathematisch korreliert. Multivariate Verfahren werten solche solche Korrelationen aus um die zugrundeliegenden “Dimensionen” der Sprachvariation zu ermitteln. Ein bekanntes Beispiel ist die multidimensionale Registeranalyse von Doug Biber, die auf einer sogenannten Faktorenanalyse (FA) beruht. Sehr ähnliche Ansätze finden sich aber auch in anderen Forschungsgebieten (z.B. der Textometrie und der distributionellen Semantik), wobei verschiedene mit FA verwandte multivariate Techniken zum Einsatz kommen (z.B. Korrespondenzanalyse (CA) oder Hauptkomponentenanalyse (PCA)).
Mein Vortrag zeigt verschiedene methodologische Schwierigkeiten und Fallstricke der multivariaten Analyse von Sprachvariation auf. Anhand mehrerer Fallstudien gebe ich “best practice”-Empfehlungen und stelle einen neuen, minimal überwachten Ansatz vor, mit dem verschiedene Aspekte der Sprachvariation voneinander getrennt und auch feinere Muster untersucht werden können.
Beitrag von: Christof Schöch
Redaktion: Christof Schöch