Results for ' annotation de corpus écrit'

967 found
Order:
  1.  23
    Constitution d’un grand corpus d’écrits émergents et novices : principes et méthodes.Sarah De Vogüé, Natacha Espinoza, Brigitte Garcia, Marie Perini, Frédérique Sitri & Marzena Watorek - 2017 - Corpus 16.
    Constitution d’un grand corpus d’écrits émergents et novices : principes et méthodes Cette contribution propose une réflexion sur la construction d’un vaste corpus d’écrits qui permet d’approfondir notre compréhension des processus en jeu dans l’accès à la littératie dans sa diversité, au travers de la pluralité des genres et des types discursifs qui la constituent et chez des apprenants de profils divers : enfants/adultes, langue 1 / langue 2, entendants/sourds. La réflexion sur la mise en place de ce (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  2.  18
    Vers l’annotation discursive de textes d’élèves.Claudine Garcia-Debanc, Lydia-Mai Ho-Dac, Myriam Bras & Josette Rebeyrolle - 2017 - Corpus 16.
    La contribution se propose de mettre en évidence les problèmes épistémologiques et méthodologiques posés par l’annotation discursive de productions écrites d’élèves et les choix techniques qu’implique sa mise en œuvre. Dans un premier temps, l’article montre l’intérêt scientifique de la constitution de « grands » corpus scolaires rassemblant plusieurs centaines de textes d’élèves d’école primaire et de collège de niveaux scolaires différents répondant à une même consigne. L’unicité de la consigne permet de comparer les productions en vue d’élaborer (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  3.  17
    Un « corpus de littéracie avancée : résultat et point de départ.Marie-Paule Jacques & Fanny Rinck - 2017 - Corpus 16.
    Le corpus de littéracie avancée réunit des écrits universitaires et professionnels produits par des étudiants du niveau Licence 1 au Master 2. Il contient actuellement 338 textes (+ d’1 million de mots) et est mis à disposition au format xml, assorti de métadonnées (niveau, discipline, genre, consigne d’écriture etc.). Il est à la fois un aboutissement et un point de départ dans le champ de la littéracie avancée : parce que l’enjeu n’est pas tant de constituer des corpus (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  4.  21
    Apports du TAL à la constitution et à l’exploitation d’un corpus scolaire au travers du développement d’un outil d’annotation orthographique.Claire Wolfarth, Claude Ponton & Corinne Totereau - 2017 - Corpus 16.
    Le travail présenté dans cet article s’inscrit dans une recherche qui a pour but la constitution d’un corpus scolaire et le développement d’un outil d’aide à son exploitation à partir de l’annotation de phénomènes linguistiques saillants. Nous nous concentrerons ici sur les écrits produits en fin de classe de CP par des scripteurs encore débutants. L’objet de ce travail est d’explorer les possibilités qu’offre le traitement automatique des langues pour appréhender ces écrits particulièrement éloignés de la norme. L’hypothèse (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  5.  17
    Problèmes posés par la transcription et l’annotation d’écrits d’élèves.Claire Doquet, Vanda Enoiu, Serge Fleury & Sara Maziotti - 2017 - Corpus 16.
    Les écrits scolaires posent des problèmes d’analyse automatique à cause des nombreux écarts à la norme langagière qu’ils comportent. Dans le but de constituer et de rendre exploitable un corpus significatif d’écrits d’élèves, le groupe de recherche ECRISCOL (Écrits Scolaires) de l’université de la Sorbonne Nouvelle a élaboré des solutions techniques pour préserver l’accès aux manuscrits des élèves tout en rendant possible une analyse automatique par des logiciels d’analyse textuelle. Le corpus en construction comporte une dimension développementale – (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  6.  15
    Représenter les langues des signes sous forme écrite : questions qui ont besoin (encore aujourd’hui) d’être posées.Claudia S. Bianchini - 2021 - Corela. Cognition, Représentation, Langage 19.
    Les langues des signes sont des langues qui n’ont pas un système d’écriture qui leur est propre et qui, par leur nature visuo-gestuelle, ne peuvent pas être écrites phonographiquement. Les conséquences de cette « non‑scriptibilité » sont au centre des travaux menés à partir de 2000 par Elena Antinoro Pizzuto. EAP, décédée en 2011, mettait en évidence les biais que l’utilisation des « gloses », employées comme substituts de la transcription, induisent dans l’analyse linguistique des LS. Ces 10 dernières années, (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  7.  12
    Deux étapes dans la construction de corpus scolaires : problèmes récurrents et perspectives nouvelles.Catherine Boré & Marie-Laure Elalouf - 2017 - Corpus 16.
    Deux étapes dans la construction de corpus scolaires : problèmes récurrents et perspectives nouvelles L’article met en perspective des recherches qui ont pour objectif commun la constitution de corpus scolaires recueillis dans des conditions écologiques. Il expose les questions méthodologiques qui se sont posées au départ concernant le choix et l’organisation des données, la définition d’une unité d’observation, les différentes possibilités de transcription. Les limites rencontrées dans l’exploitation de transcriptions non annotées ont conduit à l’identification de problèmes récurrents (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  8.  38
    Une procédure d’analyse et d’annotationdes chaînes de coréférence dans des textes écrits.Frédéric Landragin - 2011 - Corpus 10:61-80.
    Nous présentons une étude en cours sur la coréférence lorsque le référent est un individu ou un groupe d’individus. Avec l’objectif d’annoter manuellement les expressions référentielles et les chaînes de coréférence d’un texte écrit, nous décrivons les problèmes rencontrés et les solutions adoptées face à la nature sémantico-pragmatique des phénomènes retenus, à leur complexité, à la présence fréquente d’ambiguïtés et de sous-déterminations, et aux relations d’appartenance parfois floue d’un individu à des groupes. Nous montrons comment faire évoluer les outils (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark   2 citations  
  9.  21
    De l’entorse à la norme à l’atypicité typique : Retour sur un corpus de SMS de sourds et ses métadonnées.Michel Otell - 2019 - Corela. Cognition, Représentation, Langage 27 (HS).
    Cet article revient sur un corpus de conversations par SMS entre des personnes sourdes qui présentent un bilinguisme entre le français et la Langue des Signes Française. Ce regard rétrospectif sur ce corpus, notamment sur les motifs de son cadrage, l’enquête de terrain préalable à sa collecte, le protocole de collecte en tant que telle, ou le défi que constitue son annotation, permet de discuter des avantages et des limites des positionnements qualitatifs et quantitatifs en amont de (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  10.  27
    Le corpus PhraséoRoChe : les défis de l’établissement des textes et de l’hétérogénéité des états de la langue.Corinne Kraif Denoyelle - 2024 - Corpus 25.
    Le corpus PhraséoRoChe se centre sur le roman de chevalerie de langue française écrit en prose. Il rassemble des textes issus d’œuvres produites entre le XIIIe siècle et le XVIIe siècle, période bornée par la naissance et la disparition de ce genre textuel. Pour permettre des interrogations par le lecteur d’aujourd’hui d’un corpus outillé embrassant une diachronie aussi longue, il faut faire des choix concernant l’évolution de la langue, non seulement en traitant le décalage entre le français (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  11.  14
    The ORFEO project: a study corpus for contemporary French.Christophe Benzitoun, Jeanne-Marie Debaisieux & Henri-José Deulofeu - 2016 - Corpus 15.
    L’article présente le projet ORFEO (outils pour l’étude du Français écrit et oral). Ce projet a consisté à rassembler 4M de mots de Français oral et 6M de mots d’écrit à partir de ressources existantes. Les ressources orales ont été unifiées dans un format trs et alignées avec les fichiers sons au phonème. Les corpus sont présentés avec des métadonnées qui permettent de constituer des sous-corpus d’étude. Les données orales ont été segmentées et annotées en POS (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   2 citations  
  12.  30
    Corpus de langue des signes : situer les biais des méthodes d'annotation et d'analyse.Annelies Braffort, Emilie Chételat-Pelé & Jérémie Segouat - 2011 - Corpus 10 (10):25-40.
    Cet article propose un tour d’horizon de différents types de biais que l’on peut rencontrer dans les études basées sur l’annotation de corpus vidéo de langue des signes. En tâchant de situer objectivement les choix effectués et les biais potentiels à chaque étape, nous décrivons les méthodologies que nous avons mises en place dans trois études, portant respectivement sur la synchronisation des composantes corporelles, le mouvement des sourcils et les clignements des yeux, puis la coarticulation.
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  13.  31
    Annotation de textes d’états de langue anciens : pour le redéploiement de l’existant.Adam Kraif Renwick - 2024 - Corpus 25.
    Dans le cadre de la construction du corpus PhraseoRoChe, un corpus diachronique rassemblant des romans de chevalerie du 13e au 17e siècle, cet article s’intéresse aux performances de différents analyseurs (étiqueteurs, lemmatiseurs, parseurs en dépendances) entrainés sur des états de langue connexes allant de l’ancien français au moyen français et au français moderne. Nous étudions ainsi la possibilité d’étendre ces analyseurs au-delà des états de langues précis sur lesquels ils ont été entrainés, en s’appuyant notamment sur les divergences (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  14.  60
    Annoter la polyphonie dans les textes : le cas des passages entre guillemets.Fanny Rinck & Agnès Tutin - 2007 - Corpus 6:79-100.
    Dans cet article, nous présentons une étude de faisabilité sur l’annotation des passages entre guillemets, phénomènes linguistiques polyphoniques qui résistent souvent à une lecture univoque et à un schéma d’annotation simplificateur. La faisabilité de l’annotation a été testée à travers une étude inter-annotateurs qui a montré, avec un accord pour 80% des annotations effectuées, que des valeurs stables (dénomination, citation, autonymie, commentaires modalisants) pouvaient être postulées. Les cas de désaccord, en partie inévitables face à la complexité du (...)
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  15.  20
    Le forum de coélaboration de connaissances (FCC) : une base de données à analyser.Marie-Eve Desrochers & Godelieve Debeurme - 2017 - Corpus 16.
    L’intégration des technologies de l’information et de la communication (TIC) à l’apprentissage représente une avenue explorée à la fois par les milieux scientifique, institutionnel et scolaire afin de développer des environnements éducatifs stimulants pour les apprenants. Au Québec, L’École en réseau, un projet d’innovation technologique rassemblant 23 commissions scolaires et près d’une centaine d’écoles majoritairement de l’ordre primaire (6 à 12 ans), a mis entre autres en place le forum de coélaboration de connaissances (FCC) pour répondre à certains besoins émergents (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  16.  26
    Syntactic Annotation of Old French Text Corpora.Achim Stein - 2008 - Corpus 7.
    Dans un premier temps, cette contribution fournit une présentation rapide des corpus médiévaux, principalement pour l’anglais et le français, en relation avec des projets d’annotation centrés sur l’annotation syntaxique. La seconde partie traite des aspects spécifiques de l’annotation syntaxique pour les textes d’ancien français et s’intéresse particulièrement aux interactions entre la préannotation automatique et les outils d’annotation manuelle.
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  17.  19
    Enjeux des corpus bilingues en diachronie longue : l’exemple du projet MICLE.Mathieu Goux - 2024 - Corpus 25.
    La multiplication des très grands corpus en linguistique historique a entraîné des discussions nombreuses sur les procédures d’annotation et les métadonnées associées, notamment concernant les questions relevant de l’étiquetage morphosyntaxique et de la tokenisation. D’autres sujets cruciaux, en revanche, semblent moins abordés, comme la question de la découpe en propositions ou en « phrases » des données linguistiques, la préservation des informations philologiques ou, encore, la question de l’encodage et des formats de données. Notre contribution explore ces thématiques (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  18.  65
    Forme et fonction de la périphérie gauche dans un corpus oral multigenres annoté.Laurence J. Martin, Liesbeth Degand & Anne-Catherine Simon - 2014 - Corpus 13:243-265.
    La présente contribution propose une étude de la périphérie gauche au sein d’un corpus oral multigenres, représentant douze activités de communication orale, annoté syntaxiquement et prosodiquement. La segmentation discursive du corpus en unités de base du discours (BDU) résulte d’une coïncidence entre unités syntaxiques et prosodiques, correspondant à des encodages linguistiques distincts mais complémentaires. Partant du postulat selon lequel ces unités discursives remplissent une fonction cognitive dans la planification et l’interprétation du discours, nous nous intéressons à l’étude de (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   2 citations  
  19.  44
    Les Ecrits des Pères Apostoliques, Annotés par F. Louvel. Préface de L. Bouyer. Introduction de C. Mondésert. [REVIEW]P. D’Amato - 1965 - Augustinianum 5 (1):182-182.
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  20.  25
    La constitution de corpus en diachronie longue : méthodologies, objectifs et exploitations linguistiques et stylistiques.Julie Kraif Sorba - 2024 - Corpus 25.
    Depuis plusieurs décennies, la numérisation des textes anciens et les progrès du TAL pour les traiter et les interroger ont largement modifié nos habitudes de travail. Il est désormais possible d’obtenir des données quantitatives massives qui affinent notre perception des phénomènes linguistiques et stylistiques dans des corpus écrits dans des états de langue anciens. Les corpus numériques créés depuis maintenant près d’un quart de siècle permettent d’envisager plus facilement la dynamique du...
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  21.  55
    Amelot de La Houssaye (1634-1706) Annotates Tacitus.Jacob Soll - 2000 - Journal of the History of Ideas 61 (2):167-187.
    In lieu of an abstract, here is a brief excerpt of the content:Journal of the History of Ideas 61.2 (2000) 167-187 [Access article in PDF] Amelot de La Houssaye (1634-1706) Annotates Tacitus Jacob Soll Thousands have worked on Tacitus. Some have translated him, others have commented on him. Some have put his text into paraphrases, because of his obscurity: Some others have sucked out the juice and marrow, which is to say, the Sentences, Aphorismes, Apophtegms, and the Political Axioms, of (...)
    Direct download (5 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  22.  31
    Système graphique et communauté des « professionnels de l’écrit ».Analyse linguistique du manuel de Guillaume Flambart.Isabelle Bretthauer - 2018 - Corela. Cognition, Représentation, Langage.
    Depuis la fin du xiiie siècle et le « moment 1300 », l’Occident connaît une large diffusion de savoirs sur l’écrit juridique et gestionnaire. Ces savoirs semblent cependant se limiter à un groupe spécifique, celui des « clercs », « notaires » ou juristes, qui font de cette maîtrise le socle de leur activité professionnelle : apparaissent alors des usages graphiques participant de la construction de cette identité professionnelle. À partir du milieu du xive siècle, cependant, nous pouvons observer (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  23.  37
    Un corpus pour l’analyse de la variation et du changement linguistique.France Martineau - 2008 - Corpus 7.
    Cet article offre une réflexion sur la constitution de corpus pour l’analyse de la variation et du changement morphosyntaxique. Le Corpus MCVF (Modéliser le changement : les voies du français) est structuré de façon à permettre l’analyse de la variation morphosyntaxique, à travers plusieurs périodes historiques, tout en tenant compte, dans une certaine mesure, de facteurs sociolinguistiques comme la distribution sociale et régionale. Les principes qui sous-tendent la sélection des textes et leur annotation morphosyntaxique sont d’abord présentés. (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark   4 citations  
  24.  43
    Le schwa en français : pourquoi des corpus?Jacques Durand & Julien Eychenne - 2004 - Corpus 3.
    L’objectif principal que nous poursuivons dans cet article est de montrer que pour un phénomène aussi complexe que le schwa, qui ne se laisse pas appréhender de manière triviale, la constitution de corpus s’appuyant sur une méthodologie rigoureuse et explicite est un élément indispensable de la construction des objets phonologiques. A cette fin, nous nous concentrons sur l’étude de la position finale, et plus spécifiquement de l’opposition /Cə#/ vs /C#/, à la lumière de trois enquêtes du projet « Phonologie (...)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark   2 citations  
  25.  15
    Le français écrit : transcription et édition. Le cas des textes scolaires.Marie-Noëlle Roubaud - 2017 - Corpus 16.
    Notre expérience de constitution d’une base de données orale (au sein du Groupe aixois de recherches en syntaxe) nous a servi à constituer, à la fin des années 90, une base de données d’écrits scolaires manuscrits (élèves de 5 à 11 ans). L’article rend compte des questions inhérentes à la constitution d’un tel corpus : du recueil de données à leur transcription et à leur édition. Si les méthodes d’analyse de l’oral peuvent résoudre certains des problèmes rencontrés, elles ne (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  26.  43
    WEIL, S. "Œuvres Complètes". Tome V, Vol. 2. Édition publié sous la direction de Robert Chenavier. "Écrits de New York et de Londres - L’Enracinement. Prélude à une déclaration des devoirs envers l’être humain". Les textes de ce volume on tété établis, présentés et annotés par Robert Chenavier et Patrice Rolland avec la collaboration de Maire-Noëlle Chenavier-Jullien. Paris: Gallimard, 2013. 462p. [REVIEW]Fernando Rey Puente - 2014 - Kriterion: Journal of Philosophy 55 (130):765-771.
    Tomando como ponto de partida o diálogo "Clara", escrito por Schelling, o autor faz da conexão da Natureza com o Espírito o fio condutor da trajetória do pensamento schellinguiano. É, antes de tudo, na disputa com as filosofias de Fichte e Hegel, que se revela a convergência entre a concepção transcendental do Espírito e a filosofia da Natureza, dando-se assim a entender a importância de um conceito especulativo da Natureza como acesso ao mundo real. Taking the dialogue "Clara", written by (...)
    Direct download (4 more)  
     
    Export citation  
     
    Bookmark  
  27.  22
    Chaînes de référence dans le corpus Democrat : une analyse en diachronie longue.Frédéric Glikman Landragin - 2024 - Corpus 25.
    Le corpus Democrat, annoté en expressions référentielles et en chaînes de référence, est paru fin 2019 et a déjà fait l’objet de plusieurs études. Trois ans plus tard, on constate qu’il manque encore des statistiques sur l’ensemble du corpus, et des analyses qui tiennent compte des données à la fois d’un point de vue global – fréquence d’apparition de phénomènes, par ex. – et d’un point de vue local, avec la remise en perspective des annotations dans leur contexte (...)
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  28.  22
    Transcrire des écrits scolaires : entre philologie et génétique textuelle.Pierre-Yves Testenoire - 2017 - Corpus 16.
    Transcrire des écrits scolaires : entre philologie et génétique textuelle Cet article propose une réflexion épistémologique sur les problèmes posés par la transcription d’écrits scolaires pour la constitution d’un corpus informatisé. Il interroge l’opération de transcription de manuscrits dans deux cadres théoriques : la philologie et la génétique textuelle. On examine les modèles proposés dans ces deux cadres, les possibilités mais aussi les problèmes rencontrés pour la transcription d’écrits parfois non normés comme le sont les écrits d’élèves. À partir (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  29.  27
    Profiterole : un corpus morpho-syntaxique et syntaxique de français médiéval.Sophie Grobol Prévost - 2024 - Corpus 25.
    Le projet ANR Profiterole avait pour objectifs la constitution de ressources pour le français médiéval (9e-15e s.) : un corpus annoté en (morpho-)syntaxe et des lexiques, la conception d'analyseurs syntaxiques pour le français médiéval, le développement d’outils de diffusion et d’analyse textométrique de l’annotation syntaxique dans le contexte de la plateforme TXM, et, enfin, la modélisation de certains aspects syntaxiques de l’évolution du français. Nous commençons par décrire la constitution du corpus Profiterole en termes de choix de (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  30. Lettres de Simone Weil à Boris Souvarine.PréSentation Et Annotations de Charles Jacquier - 1998 - In Simone Weil, Simone Weil, l'expérience de la vie et le travail de la pensée. Arles: Editions Sulliver.
    No categories
     
    Export citation  
     
    Bookmark  
  31.  54
    Elaboration d’une base de données d’exemples de structures comparatives : de la grille d’annotation au système d’interrogation.Frédérique Melanie-Becquet & Catherine Fuchs - 2011 - Corpus 10:273-295.
    Le présent article retrace les étapes qui ont présidé à l’élaboration d’une base de données d’exemples de structures à subordonnées comparatives du français. Ce travail a été réalisé dans le cadre du projet « Structures à Subordonnées Comparatives du français » (SCF). Piloté par le laboratoire LaTTiCe sous la direction de C. Fuchs, ce projet a réuni des membres de quatre laboratoires français : B. Combettes et A. Kuyumcuyan (ATILF, Nancy), C. Guimier (CRISCO, Caen), N. Fournier et M. Morinièr...
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  32.  24
    La BFM 2022 : un corpus pour les recherches diachroniques en français médiéval et au-delà.Alexei Guillot-Barbance Lavrentiev - 2024 - Corpus 25.
    La Base de français médiéval (BFM) fait partie des corpus de français médiéval (9e-15e s.) les plus anciens et les plus utilisés par les linguistes diachroniciens et plus largement par tous ceux qui s’intéressent à l’histoire du français. Elle est le fruit d’une collaboration entre linguistes-philologues et spécialistes de la méthode textométrique implémentée dans la plateforme TXM. L’article présente un état des lieux du corpus BFM2022 focalisé sur la représentativité et l’interopérabilité des données. Il illustre l’apport des outils (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  33.  14
    Studying reference and coreference: the roles of small corpora and observations from the MC4 corpus[REVIEW]Frédéric Landragin - 2018 - Corpus 18.
    Nous présentons un ensemble d’observations et de repères méthodologiques issus de la constitution et de l’annotation du corpus MC4 « Modélisation Contrastive et Computationnelle des Chaînes de Coréférences », corpus de (très) petite taille qui a permis des expérimentations, des études de faisabilité puis l’élaboration d’un corpus de beaucoup plus grande taille, celui du projet Democrat « Description et modélisation des chaînes de référence : outils pour l’annotation et le traitement automatique ». Nos remarques traitent (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  34.  7
    Des bruits dans mon corpus : des données à réduire au silence, à atténuer ou à écouter attentivement?Loïc Liégeois - 2025 - Corpus 26 (26).
    In the field of NLP, “noise” is a notion with many different meanings. This is also true in fields of linguistics in which the analysis of ecological data is central.In studies involving corpus linguistic methods, noise management is an essential process for data collection, data structuration and data analysis. Paradoxically, this step is almost never developed, or completely ignored.In this paper, we propose to focus on the management of noise during the various stages classically defined in the processing of (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  35.  25
    Corpus and writing activity of dyslexic and dysorthographic adolescents in the framework of regular speech therapy.Agnès Witko & Florence Chenu - 2018 - Corpus 19.
    Selon l'étude européenne translinguistique Neurodys (Becker et al., 2013), la prévalence de la dyslexie touche entre 5 et 10% des enfants âgés de 8 à 12 ans. L’apprentissage du langage écrit revient à maîtriser conjointement ses deux versants : lecture et écriture. La présente étude vise l’analyse des processus d'écriture utilisés par des scripteurs dyslexiques (DL) et dysorthographiques (DO). Afin de favoriser les collaborations chercheurs-praticiens, comme le proposent Hayes et Berninger (2014), nous étudions les données chronométriques relatives à un (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  36.  26
    Les corpus de la communication médiée par les réseaux : une introduction.Céline Poudat, Ciara R. Wigham & Loïc Liégeois - 2020 - Corpus 20.
    Si le développement du web a rendu accessibles des masses de données numériques, facilitant la collecte de textes et le développement de corpus, il a également donné naissance à de nouveaux genres qui défient les représentations, les méthodes et les grilles d’analyses développées jusqu’à présent. Ainsi a-t-on vu apparaître des corpus assez éloignés des premiers corpus écrits traditionnels, regroupés sous la bannière de la CMR (Communication Médiée par les Réseaux / Computer-Mediated Communica...
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark   1 citation  
  37.  19
    Compte rendu de Jean-Luc Evard, Georg Simmel. Face à la guerre : écrits 1914-1916.Caterina Zanfi - 2016 - Methodos 16.
    Dès l’éclatement de la Grande Guerre, beaucoup de philosophes européens ont prêté leurs idées aux motifs de la propagande : les résultats ont souvent été simplistes et caricaturaux, à tel point qu’on a cédé, dans la plupart des cas, à la tentation d’exclure totalement ou presque les discours de guerre des corpus des œuvres théoriques de leurs auteurs. Ainsi la traduction des écrits de guerre simmeliens que Jean-Luc Evard présente pour la première fois aux lecteurs français se place à (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  38.  10
    Hegel et l'Orient: suivi de la traduction annotée d'un essai de Hegel sur la Bhagavad-Gita.Michel Hulin - 1827 - Paris: J. Vrin. Edited by Georg Wilhelm Friedrich Hegel.
    Hegel et l'Orient vise a combler une lacune : dans les cours de Berlin consacres a la Philosophie de l'Histoire et a la Philosophie de la Religion, l'Orient occupe une place considerable, mais cette enorme masse de textes n'a guere jusqu'ici retenu l'attention des historiens de la philosophie. L'auteur s'efforce tout d'abord de reperer les motifs qui ont conduit Hegel a elever a la dignite de categorie philosophique le tres ancien mythe de l'Orient et de replacer cette reconstruction historico-speculative dans (...)
    Direct download  
     
    Export citation  
     
    Bookmark   2 citations  
  39.  40
    Du corpus littéraire au corpus linguistique : dématérialisation, restructuration, lectures rhizomatiques et analyses linguistiques des manuscrits.Thomas Lebarbé - 2009 - Corpus 8:221-239.
    L’auteur, responsable des aspects informatiques et linguistiques du projet « Manuscrits de Stendhal en ligne », décrit le processus de constitution d’un corpus, au sens linguistique du terme, dans le cadre d’une collaboration fortement interdisciplinaire. Il montre dans quelle mesure ce type de collaboration permet de construire un ensemble documentaire répondant aux besoins des chercheurs en littérature tout en apportant un matériau langagier riche et inédit pour le linguiste. Subséquemment, ce n’est pas l’objet de l’étude qui définit le (...) à construire, mais à l’inverse, c’est le corpus construit qui limite et contraint les observations, remettant ainsi en question la notion d’analyse de corpus. (shrink)
    No categories
    Direct download (3 more)  
     
    Export citation  
     
    Bookmark  
  40.  24
    Corpus and language disorders: from data collection to analyses for clinical and applied linguistics.Christine Da Silva Genest & Caroline Masson - 2018 - Corpus 19.
    Ce numéro thématique a pour objectif de réunir un ensemble de contributions s’attachant à rendre compte de la constitution et de l’utilisation de corpus de données orales ou écrites dans le champ des pathologies du langage. Plus précisément, notre ambition est de montrer ce que les données issues de situations réelles peuvent apporter aux connaissances actuelles dans ce domaine. Nous considérons, à l’instar de (de Weck & Rodi 2005 ; de Weck & Marro 2010 ; MacLeod et al. 2011 (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  41.  44
    Plotin, «Ennéades I, 3». Sur la dialectique Vladimir Jankélévitch Préface de Lucien Jerphagnon, édition établie par Jacqueline Lagrée et Françoise Schwab Collection «Écrits de Plotin» Paris, Éditions du Cerf, 1998, 139 p. [REVIEW]Richard Dufour - 1999 - Dialogue 38 (3):617-.
    Après les traités 38, 50 et 25, les Éditions du Cerf récidivent avec un nouveau titre, le traité 20 Sur la dialectique. Il faut toutefois aborder ce livre d’une manière toute spéciale, car il se distingue radicalement des autres parutions de cette collection. L’auteur, Vladimir Jankélévitch, s’est en effet éteint à Paris en 1985, à l’âge de quatre-vingt-deux ans. Le travail qu’on offre au public prend donc la forme d’un hommage posthume à ce philosophe français dont les publications s’étendent sur (...)
    Direct download (4 more)  
     
    Export citation  
     
    Bookmark  
  42.  13
    Tagset adaptation to language changing over time. The case of the masculine personal category in the Electronic Corpus of 17th and 18.Aleksandra Wieczorek - 2024 - Corpus 25.
    Cet article présente les solutions utilisées pour le Corpus électronique des textes polonais des 17e et 18e siècles afin d’adapter son jeu de balises grammaticales à l’évolution du système morphologique qui a eu lieu au cours de la période. Les 17e et 18e siècles ont été marqués en effet par la formation d’une nouvelle catégorie grammaticale, appelée « masculine-personality » (Pl. *męskoosobowość*). Cette époque marque une transition de l’état ancien à l’état moderne et se caractérise par une variation significative (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  43.  27
    Constitution d’un corpus plurilingue en sociolinguistique historique : objectifs, méthodologie et défis.Carole Werner - 2024 - Corpus 25.
    Cet article présente et discute la méthodologie de construction d’un corpus plurilingue en diachronie longue (1681-1914). Puisqu’il n’existait pas de corpus alsacien significatif, un important travail de construction d’un corpus significatif a été mené afin de constituer un corpus documentant les contacts linguistiques dans les écrits des locuteurs-scripteurs alsaciens. Cette tâche a présenté un certain nombre de défis méthodologiques causés par le contact des langues, la variation sociolinguistique et diachronique, le manque de sources primaires et de (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  44.  17
    Un corpus multimodal pour étudier les interactions par visioconférence pour le développement des compétences techno-pédagogiques en didactique des langues et formation de formateurs.Marco Holt Cappellini - 2023 - Corpus 24.
    This article aims to describe the construction and annotation of a multimodal and multilingual (French, English, and Mandarin Chinese) corpus for the study of second language acquisition and professional development in language teaching. The corpus was built within a research project whose main objective is to determine which techno-semio-pedagogical competencies are developed informally and which ones require formal training. In this paper, we explain the theoretical framework adopted, characterized by an ecological approach to the interactive environment. We (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  45.  21
    Eléments initiaux : combinaisons et schémas préférentiels dans un corpus d’articles scientifiques.Frédérique Mélanie-Becquet & Sophie Prevost - 2014 - Corpus 13:29-60.
    La présente contribution s’attache à l’étude, dans un corpus d’articles scientifiques en sciences humaines, de la zone préverbale, c’est-à-dire des éléments initiaux (EI) et du sujet préverbal. Il s’agit de déterminer les combinaisons attestées des différents EI (11 catégories définies par des critères sémantiques et morpho-syntaxiques) en relation avec la nature du sujet. L’étude permet tout d’abord de déterminer que les séquences sans EI (sujet initial) excèdent celles avec EI, et que, parmi ces dernières, celles avec un seul EI (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  46.  1
    La question de la normalisation des écrits scolaires pour leur traitement automatique. Le cas de l’omission de mots.Martina Ponton Barletta - 2025 - Corpus 26 (26).
    This paper addresses the treatment of noise caused by word omissions in a corpus of school writings, in order to facilitate their subsequent automatic processing. While a normalization step may facilitate the processing of these texts, certain linguistic expressions remain challenging to comprehend, particularly in instances where the writer omits words from the text. The present contribution proposes three automatic and semi-automatic potential solutions to this problem. The first method employs a "mask" token in the form of xxx. The (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  47.  6
    George Sand Critique 1833-1876, Textes de George Sand sur la littérature, présentés, édités et annotés et George Sand Littérature et Politique. [REVIEW]Máire Cross - 2010 - Clio 32.
    La richesse des œuvres de George Sand ne cessent de nous éblouir : deux ouvrages témoignent de l’étendue de sa production littéraire dans un contexte historique bien précis grâce à des chercheurs connus et moins connus qui ont soigneusement édité ses écrits. Le contexte est d’autant plus important pour notre compréhension de son engagement public. Contrairement à la notion de l’auteur romantique qui se coupe du monde dans une solitude artistique, George Sand est ici dans sa splendeur de femme...
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  48.  9
    Fortunée Briquet, Dictionnaire historique des Françaises connues par leurs écrits (édition commentée de Nicole Pellegrin).Siân Reynolds - 2018 - Clio 48.
    « Aucun siècle n’a commencé avec un aussi grand nombre de femmes de lettres ; aucun siècle, sans doute, n’aura vu l’éducation des femmes plus soignée. » Nous sommes en 1804, il s’agit du jeune xixe siècle, et Fortunée Briquet, 22 ans, dédie son Dictionnaire, que l’on peut qualifier de « proto-manifeste féministe », au… Premier Consul et Président, Napoléon Bonaparte. Ce n’est pas le moindre des paradoxes et particularités de ce livre admirablement commenté, annoté et présenté par Nicole Pelle...
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  49.  6
    El archivo Foucault: un corpus documental diverso.Hernán Darío Ocampo Giraldo & María Cristina Conforti Rojas - 2023 - Discusiones Filosóficas 24 (43):37-55.
    Este artículo muestra que la obra de Foucault puede dividirse en cuatro categorías de documentos: los libros publicados en vida, los documentos de Dits et écrits, los cursos del Collège de France y los textos póstumos. Cada categoría tiene un registro distinto: los libros publicados en vida del autor representan para el investigador un corpus documental más confiable, pues se trata de una obra revisada, aprobada y finalizada por Foucault. Los documentos de Dits et écrits son diversos, y tienen (...)
    No categories
    Direct download (2 more)  
     
    Export citation  
     
    Bookmark  
  50.  27
    La dislocation en italien : une étude sur corpus.Sandra Augendre - 2010 - Corpus 9:221-244.
    L’article propose d’étudier la dislocation en italien, structure productive tant dans la dimension orale qu’écrite de la langue. A partir des caractéristiques communément attribuées à cette structure, le travail consiste, sur la base d’un corpus écrit, à analyser les occurrences de dislocation aux niveaux formel et communicatif, afin de montrer que cette construction syntaxique n’est pas un objet unique mais pluriel.
    No categories
    Direct download (4 more)  
     
    Export citation  
     
    Bookmark  
1 — 50 / 967