Frist: 2016-07-30

Beginn: 2016-09-01

Ende: 2019-08-31

Contrat doctoral de 3 ans dans le cadre du Projet ANR-DFG SegCor : Segmentation of oral corpora

1 Le projet de recherche

Dans le domaine de la linguistique sur corpus oraux, différents principes de segmentation de la parole en unités ont été proposés sans que cela ne donne lieu à une méthode robuste de segmentation applicable à de grands corpus de parole en interaction, pour le français ou d’autres langues. Ce projet vise à développer une méthodologie de segmentation en unités situées à différents niveaux d’analyse de la langue et donc susceptible d’être utilisée par différentes communautés de chercheurs. Il vise à évaluer différents modèles existant dans la littérature spécialisée (linguistique interactionnelle, pragmatique, macro-syntaxe, linguistique de corpus) en les appliquant à un échantillon d’enregistrements oraux audio et vidéo de français et d’allemand (issus de 3 bases de données : CLAPI, ESLO pour le français, FOLK pour l’allemand). Le projet aboutira à la mise à disposition d’un corpus franco-allemand segmenté et à la diffusion de guidelines pour la segmentation en unités pertinentes pour l’oral dans une perspective contrastive.

Coordinateurs du projet:

  • ANR : Véronique Traverso (ENS-Lyon, CNRS-UMR ICAR), Marie Skrovec (Université Orléans, CNRS UMR LLL)
  • DFG : Thomas Schmidt et Arnulf Deppermann (IDS Mannheim)

2 Description du poste de doctorant

Thèmes de recherche par mots-clés : français oral, allemand oral, interaction, syntaxe, macro-syntaxe, annotation morphosyntaxique, TAL.

La recherche doctorale du candidat ou de la candidate portera sur l’analyse de corpus oraux de français (en incluant si possible une perspective contrastive avec l’allemand). Il s’agira de décrire, tester et analyser différents critères de segmentation de l’oral et les différents types d’unités qui en résultent, en s’appuyant sur des modèles de segmentation existants (linguistique interactionnelle, syntaxe, macro-syntaxe) et/ou en définissant un nouveau modèle, dans une perspective de traitement automatique.

Le candidat ou la candidate mènera sa recherche à partir d’un corpus de travail déjà constitué issu de différentes bases de données (CLAPI et ESLO pour le français, FOLK pour l’allemand le cas échéant). Il participera aux tests de segmentation et aux analyses contrastives et contribuera à la rédaction d’un livret de consignes pour la segmentation de données orales. Il participera également à la constitution d’un second sous-corpus plus large qui permettra de vérifier la validité des premiers tests. Par ailleurs, le candidat ou la candidate assistera le coordinateur dans l’organisation des rencontres entre les 3 équipes et dans les tâches éditoriales liées aux publications.

Profil:

  • Master en Sciences du Langage, en études germaniques, études romanes avec spécialité en linguistique française, avec mention
  • Bonne à très bonne maîtrise du français ; une connaissance de l’allemand est souhaitée, afin de permettre au minimum de comprendre les analyses faites sur le corpus oral dans cette langue
  • Bon niveau d’anglais académique, oral et écrit
  • Familiarité avec les domaines de la linguistique concernés, connaissance des méthodes de la linguistique de corpus ou engagement de vouloir les acquérir
  • Capacité de travailler en autonomie et en tant que membre d’une équipe
  • Le poste offre l’occasion d’intervenir dans les enseignements du Département de Sciences du Langage de l’Université sans qu’il prévoie l’obligation d’enseignement.

Co-direction de thèse: Marie Skrovec (LLL, Orléans) et Véronique Traverso (ICAR, Lyon)

Conditions financières : Un financement pour un contrat doctoral de trois ans à temps plein est prévu dans le cadre du projet ANR/DFG.

Date du début du contrat : le 1er septembre 2016

Comment poser sa candidature ?

Les candidat(e)s intéressé(e)s sont invité(e)s à envoyer un CV et une lettre de motivation précisant leurs domaines d’expertise et leurs expériences antérieures en matière de recherche ainsi que les coordonnées de deux personnes de référence à marie.skrovec@univ-orleans.fr avant le 30 juillet 2016. L’examen des candidatures se poursuivra jusqu’à ce que le poste soit pourvu.

Informations complémentaires

Le doctorant sera rattaché au Laboratoire Ligérien de Linguistique (LLL UMR 7270, Université d’Orléans) et à l’équipe de recherche ESLO. Pour plus d’information sur le projet doctoral, veuillez vous adresser à marie.skrovec@univ-orleans.fr

Une présentation des équipes et projets de recherche peut être trouvée sur les sites suivants :

Orléans http://www.lll.cnrs.fr/eslo-1
Lyon http://icar.univ-lyon2.fr/projets/corinte/, http://clapi.ish-lyon.cnrs.fr/
Mannheim http://agd.ids-mannheim.de/folk.shtml


Eine Meldung von Marie Skrovec

Beitrag von: Redaktion romanistik.de

Redaktion: Christof Schöch