Nous avons ici deux corpus, deux ensemble de textes : l’un constitué des commentaires sur les retards TER et l’autre sur les retards TGV. Pour le traitement dans IRaMuteQ, l’ensemble des textes d’un corpus doit être regroupé dans un fichier texte (.txt) au format UTF8. Les textes sont séparés par une ligne « étoilée » … Lire la suite de Importation des données
Traitement IRaMuteQ des commentaires textuels
IRaMuteQ, Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires, est un logiciel libre et gratuit, développé par Pierre Ratinaud. Il propose différents types d’analyses basées sur les méthodes statistiques (calculs de spécificités, analyses factorielles ou méthode Reinert), la visualisation de données textuelles (nuage de mots) et l’analyse de réseaux de mots (analyses de similitudes). La lexicométrie peut être définie comme un « ensemble de méthodes permettent d’opérer des réorganisations formelles des textes et des analyses statistiques portant sur le vocabulaire d’un corpus. […] Il ne s’agit non pas de chercher le sens d’un texte, mais de déterminer comment sont organisés les éléments qui le constituent. » Nous avons privilégié cette approche à la textométrie en raison du caractère sociologique de nos données.
Description et analyse des corpus
Statistiques descriptives Après lemmatisation et indexation par le logiciel, le corpus CRTER est formé de 910 unités d’analyses textuelles, de 914 segments de textes et de 25 847 occurrences réparties en 2 061 formes différentes. Il contient 991 hapax, occurrences dont la fréquence est de 1, soit 3,83% des occurrences et 48,08% des formes. Le … Lire la suite de Description et analyse des corpus
Discussion des résultats
Les résultats d’une analyse textuelle sont tributaires des travaux de préparation du corpus (suppression des fautes d’orthographes, neutralisation de certaines formes, pas d’abréviations). Il est nécessaire pour mener à bien de ce travail de pouvoir être au fait de la façon dont les données ont été recueillies. En effet, nous nous sommes aperçues que les … Lire la suite de Discussion des résultats