Abstract
Un des objectifs des niveaux élémentaire et indépendant du Cadre européen commun de référence pour les langues (CECRL) est d’amener l’apprenant — alors qu’il n’est pas encore un utilisateur autonome de la langue — à être capable d’interagir dans les situations authentiques de la vie quotidienne. Or, la plupart des matériaux pédagogiques consacrés à ces niveaux ne présentent qu’un échantillonnage partiel et souvent incomplet du langage authentique. Dans cet article, nous proposons une méthodologie dédiée, d’une part, à la construction de corpus thématiques à des fins pédagogiques aux niveaux A1+ à B1 du CECRL et, d’autre part, à l’identification du vocabulaire-clé associé.Notre approche repose sur une sélection thématique de textes allemands selon les sujets définis par le CECRL afin de créer (1) un corpus ciblé et (2) de taille relativement faible, (3) regroupant des textes (quasi-)authentiques, adaptés aux niveaux des apprenants. En accord avec les résultats issus de la linguistique de corpus, soulignant la place centrale des unités multi-lexicales (UML) dans la construction du vocabulaire, le vocabulaire-clé tiré de cette collection consiste en UML plutôt qu’en mots individuels. Le procédé de sélection est illustré à travers l’exemple concret d’un sous-thème de la catégorie « Essen und Trinken » (Nourriture) du CECRL formé à partir d’un corpus de critiques de restaurants. Nous concluons par le constat que cette approche empirique peut mener à un changement dans la perception de la nature du vocabulaire-clé susceptible d’être présenté aux apprenants aux niveaux de compétences linguistiques inférieurs.