Abstract
Le choix de l’unité statistique de segmentation du corpus, ainsi que celui de la distance entre les réponses, induit une structure sur l’ensemble des réponses. Nous proposons d’appliquer une méthodologie statistique, l’analyse factorielle multiple pour tableaux de contingence, AFMTC, pour, d’une part, comparer les structures induites sur un même corpus par différentes unités statistiques et, d’autre part, définir une distance entre textes capable de prendre en compte différentes unités et de profiter ainsi de l’information véhiculée par chacune d’elles. Pour présenter cette méthodologie, généralisation de l’analyse des correspondances aux tableaux de contingence multiples, on utilise une enquête auprès de femmes divorcées qui comporte une question ouverte sur les raisons de leur divorce. Comparison between the structures that are induced by the choice of the statistical unitThe election of the statistical unit, as well as that of the distance between responses, induces a structure on the whole of the responses. We propose to apply a statistical methodology, the multiple factorial analysis for contingency table, MFACT, in order to, on the one hand, compare the structures induced on a same corpus by different statistical units and, on the other hand, define a distance between texts able to take into account different units and so take advantage of the information that they convey. To present this methodology, a generalisation of correspondence analysis to multiple contingency tables, we use a survey carried out on divorced women, that includes an open-ended question about the reasons of their divorce.