Stadt: Wien

Frist: 2019-09-15

Beginn: 2020-09-23

Ende: 2020-09-26

URL: https://frankoromanistentag.univie.ac.at/call-for-papers/

Digitale Zugänge zu historischen Korpora der Sprachen Frankreichs

Die fortschreitende Digitalisierung eröffnet gerade den geisteswissenschaftlichen Fächern, und insbesondere der Sprachwissenschaft, neue methodische wie empirische Forschungsansätze. Während digitale Verfahren in der Forschung zu modernen Sprachstufen – beispielsweise in der experimentellen, akustischen wie perzeptiven Phonetik (z.B. mit praat oder speechrecoder) oder in der Syntaxanalyse (z.B. Freeling; http://nlp.lsi.upc.edu/freeling/demo/demo.php) – längst etabliert sind, stellen historische Korpora als Untersuchungsgegenstand sprachwissenschaftlicher Forschungen auch für die digitalen Geisteswissenschaften in mehrerer Hinsicht eine Herausforderung dar: Der Aufwand für die Digitalisierung alter Handschriften beispielsweise darf trotz entsprechenden Trainings der OCR-Software und trotz ihrer leichten Bedienbarkeit (z.B. OCR4all, Universität Würzburg) nicht unterschätzt werden.
Gerade in Frankreich wurde (an der Universität Lyon) mit TXM eine Textanalyse-Software entwickelt (Heiden et al. 2010), die auch bei historischen Korpora zum Einsatz kommt, wie etwa der Base de Français Médiéval (Guillot-Barbance et al. 2017), die einen Umfang von 170 Texten aus dem 9. bis zum 15. Jahrhundert (http://txm.bfm-corpus.org/) aufweist. Das ist ein Grund dafür, weshalb das Thema der carrefours zwischen Historizität und Digitalem für die Forschung zu den Sprachen Frankreichs von großer Relevanz ist.
Ziel der Sektion soll es sein, Frankoromanistinnen und -romanisten zusammen zu bringen, die ihre aktuellen Forschungen im Bereich der historischen Korpuslinguistik präsentieren und dabei mit digitalen Werkzeugen arbeiten. Es können beispielsweise lexikologische, phraseologische, syntaktische, orthographische oder auch textlinguistische Fragestellungen thematisiert werden; ein besonderer Fokus liegt auf den angewandten methodischen Zugängen. Darüber hinaus sollen neben dem Französischen und seinen diasystematischen Varietäten im Rahmen der Sektion auch die kleineren Sprachen Frankreichs (z.B. das Okzitanische, Katalanische etc.) Berücksichtigung finden. Konkret können im Rahmen der Sektion folgende Fragestellungen methodischer wie praktischer Art diskutiert und mögliche Entscheidungswege aufgezeigt werden:

- Probleme der Annotation historischer Korpora (unterschiedliche Orthographie, Wortstellung etc.)
- (Probleme der) Digitalisierung historischer Texte
- Konkrete Herausforderungen bei der Korpuszusammenstellung
- Methoden der digitalen Auswertung historischer Korpora

Die Sektion soll damit einen Überblick liefern, inwieweit das Potential digitaler Forschungsmethoden im Bereich der historischen Sprachwissenschaft am Beispiel der Sprachen Frankreichs bereits ausgeschöpft wird. Wir begrüßen Beiträge zu allen Aspekten digitaler Sprachgeschichtsforschung innerhalb der Galloromania und freuen uns insbesondere auch über Abstracts von Nachwuchswissenschaftlerinnen und -wissenschaftlern.
Kongresssprachen sind das Französische sowie das Deutsche. Abstracts (max. 3.000 Zeichen) für einen Vortrag können bis zum 15.01.2020 geschickt werden an: robert.hesselbach@uni-kassel.de und tanja.prohl@uni-bamberg.de

Approches numériques des corpus historiques des langues de France

L’expansion de la numérisation ouvre aux sciences humaines et en particulier à la linguistique de nouvelles voies de recherche autant méthodiques qu’empiriques. Alors que les processus numériques se sont établis depuis longtemps dans la recherche sur les langues modernes, entre autres en phonétique expérimentale, acoustique ou perceptive (par ex. avec praat ou speechrecoder) ou encore en analyse syntaxique (par ex. Freeling; http://nlp.lsi.upc.edu/freeling/demo/demo.php), les corpus historiques eux, en tant qu’éléments de recherche linguistique, représentent encore, sous plusieurs aspects, un défi pour les sciences humaines numériques. La tâche qu’implique la numérisation de vieux manuscrits notamment, ne doit pas être sous-estimée, malgré la maîtrise des logiciels OCR et malgré leur facilité d’utilisation (par ex. OCR4all, Université de Würzburg).
En France, notamment à l’université de Lyon, un logiciel d’analyse de texte – TXM (Heiden et al. 2010) – a été mis au point et peut être utilisé aussi pour des corpus historiques, comme par exemple la Base de Français Médiéval (Guillot-Barbance et al. 2017), qui comprend 170 textes du IXe au XVe siècles (http://txm.bfm-corpus.org/). C’est une raison de plus pour donner à l’intersection entre historicité et numérisation un rôle primordial pour la recherche sur les langues de France.
Le but de notre section est de permettre la rencontre entre les franco-romanistes qui proposent des travaux actuels dans le domaine de la linguistique de corpus historique, et, ce faisant, travaillent avec des instruments numériques. Ainsi peuvent être thématisées entre autres des questions de lexicologie, de phraséologie, de syntaxe, d’orthographie ou encore de linguistique textuelle. L’éclairage est mis particulièrement sur l’accès aux méthodes employées.
Par ailleurs la section se donne pour but de prendre en compte également, à côté du français et de ses variétés diasystématiques, les autres langues de France (par ex. l’occitan, le catalan etc.). Concrètement la section se propose de discuter les problèmes méthodiques et pratiques suivants et d’en esquisser de possibles solutions :

- Problèmes posés par l’annotation des corpus historiques (diverses orthographies, place des mots, …)
- Problèmes liés à la numérisation des textes historiques
- Défi concret posé par la constitution de corpus
- Méthode de dépouillement numérique des corpus historiques

La section proposera ainsi un aperçu permettant de mesurer l’ampleur avec laquelle le potentiel des méthodes de recherches numériques dans le domaine de la linguistique historique, appliquée aux langues de France, est déjà exploité. Nous accueillons les communications concernant tous les aspects de la recherche numérique en matière d’histoire de la langue au sein de la Galloromania et nous nous réjouissons tout particulièrement de la participation de jeunes chercheurs et chercheuses.
Les langues du congrès sont le français et l’allemand. Les propositions de communication (max. 3000 caractères) peuvent être envoyées jusqu’au 15.01.2020 aux adresses électroniques suivantes : robert.hesselbach@uni-kassel.de et tanja.prohl@uni-bamberg.de

Literaturverzeichnis / bibliographie
Guillot-Barbance, Céline/Heiden, Serge/Lavrentiev, Alexei (2017): “Base de français médiéval : une base de référence de sources médiévales ouverte et libre au service de la communauté scientifique“, in: Diachroniques 7, 168–184.
Heiden, Serge/Magué, Jean-Philippe/Pincemin, Bénédicte (2010): “TXM : Une plateforme logicielle open-source pour la textométrie – conception et développement”, in: I. C. Sergio Bolasco (ed.), Proc. of 10th International Conference on the Statistical Analysis of Textual Data – JADT 2010), Vol. 2, Roma, Edizioni Universitarie di Lettere Economia Diritto, 1021–1032.

Beitrag von: Robert Hesselbach

Redaktion: Robert Hesselbach