Alors que les approches basées sur l’usage telle la linguistique descriptive et la recherche sur l’acquisition sont très largement utilisées, la recherche en linguistique de corpus a connu un essor important au cours de ces dernières années. Ceci concerne tant la recherche sur l'acquisition des langues basée et orientée corpus que la recherche appliquée dans des domaines relevant de la pédagogie. Il subsiste pourtant des lacunes et des desiderata qui seraient à combler. Les corpus d’apprenant-e-s, par exemple, restent relativement unilatéraux : ils concernant principalement la langue cible anglais, des apprenant-e-s de niveau intermédiaire et supérieur, des productions écrites, et les tâches d’élicitation de la langue des apprenant-e-s varient peu. Les corpus multilingues contenant des ensembles de données en langue étrangère et en langue première (corpus parallèles), les corpus oraux et surtout les corpus de textes de jeunes apprenant-e-s de niveaux inférieurs sont beaucoup plus rares voire pratiquement inexistants pour ce qui concerne la scolarité obligatoire.
Dans ce contexte et dans la continuité des travaux réalisés sur SWIKO * pendant le programme de recherche 2016-2019, le projet WETLAND vise deux objectifs : 1) poursuivre le travail sur le corpus existant pour l’étendre, le soumettre à une analyse exemplaire approfondie et le consolider ; 2) étudier comment utiliser les corpus à des fins d'enseignement et d'apprentissage.
Dans le cadre de l'objectif 1, il s’agit d’augmenter les performances du corpus partiel d’allemand langue étrangère, encore restreint, pour obtenir des indications plus fiables sur le développement des compétences linguistiques. Les annotations sur les textes oraux doivent être revues et complétées pour inclure, par exemple, des critères de fluidité. Enfin, les textes seront évalués selon les niveaux définis dans le CECR, au moins pour les textes écrits en allemand langue étrangère.
L'objectif 2 porte sur le développement et le test de tâches basées corpus pour l’enseignement/apprentissage des langues à l’école. Il est ici fait référence à ce que l'on appelle le data-driven learning, DDL (ou apprentissage basé sur les données). Le DDL, encore peu utilisé en contexte scolaire, est considéré comme une application méthodologique et didactique prometteuse de la linguistique de corpus qui permet aux apprenant-e-s de jouer un rôle actif dans l'utilisation du corpus, au travers de l’analyse d’extraits par exemple. Une étude qualitative sur le DDL permettra d'explorer les questions suivantes : comment les tâches basées corpus pour l’enseignement/apprentissage des langues peuvent-elles être mises en œuvre en classe ? Quelles expériences les personnes concernées en font-elles ? Peut-on identifier les facteurs de succès ou d’échec ?
L'intérêt scientifique majeur de WETLAND réside dans le fait que l’on cherche à mieux comprendre comment les compétences linguistiques se développent dans les conditions actuelles de l'enseignement des langues étrangères (approches communicatives, actionnelles et partiellement orientées vers le contenu). Ceci se traduit par un objectif pratique (objectif 1) consistant à définir des attentes réalistes, soit empiriquement fondées, quant aux niveaux de performances que les apprenant-e-s doivent atteindre en matière de correction de la langue dans les langues étrangères étudiées et de contribuer ainsi à illustrer, préciser et différencier les objectifs d'apprentissage. En outre, l’objectif 1 prévoit de mettre la banque de données SWIKO à la disposition d’un cercle plus large de personnes intéressées.
L'objectif 2 se concentre sur des résultats que l’on pourra utiliser sur le plan didactique. Il s’agira de développer une documentation portant sur les tâches DDL qui auront été utilisées et testées et qui détaille les avantages et les limites de l’apprentissage basé corpus à partir d’exemples concrets, examine les facteurs de succès et d’échec et décrit la façon de mettre en œuvre les activités dans différents contextes.
* Littérature développée sur SWIKO dans le cadre de la première période de recherche (2016-2019) :
- Karges, Katharina, Studer, Thomas & Hicks, Nina Selina (i.V). Lernersprache, Aufgabe und Modalität: Beobachtungen zu Texten aus dem Schweizer Lernerkorpus SWIKO. Erscheint in ZGL, Themenheft „Gesprochene Lernerkorpora des Deutschen“.
- Karges, Katharina, Studer Thomas, Wiedenkeller, Eva (2020). Textmerkmale als Indikatoren von Schreibkompetenz. Bulletin suisse de linguistique appliquée, No spécial, 117-140.
- Karges, Katharina, Studer, Thomas & Wiedenkeller, Eva (2019). On the way to a new multilingual learner corpus of foreign language learning in school: observations about task variations. In Abel, Andrea, Glaznieks, Aivars, Lyding, Verena & Nicolas, Lionel, eds., Widening the Scope of Learner Corpus Research. Selected Papers from the Fourth Learner Corpus Research Conference. Corpora and Language in Use – Proceedings 5. Louvain-la-Neuve: Presses universitaires de Louvain, 137-165.
Le projet " DiCoi (Digitalisation et développement de la compétence d'interaction orale) " traite également des corpus comme ressource didactique numérique, mais se concentre sur les interactions orales libres en français langue étrangère.