Corpus 11:219-248 (
2012)
Copy
BIBTEX
Abstract
Les coocurrences ont surtout servi jusqu’ici à établir les relations, principalement sémantiques, que les mots ont entre eux. On les relevait certes dans un corpus, mais de façon indifférenciée, sans opposer les textes les uns aux autres. Or la comparaison des textes est la démarche habituelle quand la lexicométrie s’occupe des mots simples. On se propose ici d’étendre aux données cooccurrentielles les méthodes et les outils statistiques qui ont fait leurs preuves au niveau lexical. New Statistical Processing of Co-occurences by HYPERBASE. The co-occurrences have mainly been studied to establish semantic relations, i.e., the relation in-between words. Certainly, they use to be extracted from a corpus, but indiscriminately, without taking into consideration the text divisions. When dealing with simple words, the usual approach is the comparison of texts. Here, we propose to extend those methods, approved at the lexical level, and to enlarge the application of statistical tools even to co-occurrential data