Les Intercités Résumé statistique de la variable « Taux de régularité Intercités » La distribution des taux de ponctualité mensuelle des Intercités suit une loi normale à 85 % et est de nature dissymétrique à droite. Le taux moyen de ponctualité est de 86,15 %. Un quart des trains Intercités ont un taux de ponctualité compris entre … Lire la suite de Suivant le type de trains
Mise en Oeuvre
Suivant les caractéristiques de leurs réseaux
L’open data de la SNCF nous a fourni les caractéristiques des réseaux TER et Transilien. Afin de déterminer l’influence des caractéristiques de ces réseaux, nous avons créé des matrices de corrélations. Nous avons obtenu les tableaux suivants grâce au test de corrélation de Pearson qui mesure la dépendance linéaire entre les variables. Ces matrices permettent … Lire la suite de Suivant les caractéristiques de leurs réseaux
Suivant la circulation effective des lignes
Nous avons également réalisé des tests de corrélation de Pearson sur des variables relatives à la circulation effective des lignes. Nous avons ensuite réalisé de nouveau des matrices de corrélations pour les réseaux TER, Intercités et TGV. Matrice de corrélations des circulations effectives des lignes du réseau TER Les coefficients de corrélation les plus élevés … Lire la suite de Suivant la circulation effective des lignes
La ponctualité par zones de desserte
Afin de rendre compte au mieux de la ponctualité des trains selon les zones de desserte, nous avons choisi une représentation graphique sous forme de box plot (boîte à moustaches en français) où sont représentés le minimum, le maximum, le premier quartile, la médiane et le troisième quartile. Les TER Taux de régularité TER selon … Lire la suite de La ponctualité par zones de desserte
La ponctualité par périodes (2013-2019)
Avant de débuter le traitement sur R, nous avons recodé les mois exprimés en chiffres par leurs trois premières lettres. Puis, nous avons recodé les saisons en nouvelles variables grâce à la fonction c() et avons utilisé les années sans modification supplémentaire. Les TER Taux de régularité des TER sur douze mois (à gauche) et … Lire la suite de La ponctualité par périodes (2013-2019)
Cause des retards des TGV
Dans un premier temps, nous avons réfléchi en termes de corrélations entre les différentes causes de retard de TGV. En effet, certains retards peuvent comporter plusieurs explications, comme nous le verrons plus tard dans l’analyse textuelle des commentaires. Les abréviations retenues pour les causes de retard sont les suivantes : CE (Causes Externes), IF (Infrastructure … Lire la suite de Cause des retards des TGV
Prétraitement des données
Dans un premier temps, nous avons désigné les variables actives de l’ACP à savoir les causes de retards TGV soit 6 valeurs propres. Afin de déterminer les plus pertinentes pour la réalisation de l’ACP, nous avons utilisé le critère de Kaiser selon lequel on ne retient que les valeurs propres supérieures à 1. Valeurs propres … Lire la suite de Prétraitement des données
Importation des données
Nous avons ici deux corpus, deux ensemble de textes : l’un constitué des commentaires sur les retards TER et l’autre sur les retards TGV. Pour le traitement dans IRaMuteQ, l’ensemble des textes d’un corpus doit être regroupé dans un fichier texte (.txt) au format UTF8. Les textes sont séparés par une ligne « étoilée » … Lire la suite de Importation des données
Résultats variables et individus
Résultats des variables A partir de ce choix, nous avons calculé les composantes principales des variables, leur contribution relative aux axes et leur cosinus2 selon l’axe 1. Les composantes principales sont les coordonnées des variables sur les nouveaux axes factoriels. La contribution relative correspond aux individus ou aux modalités qui contribuent à l’inertie de l’axe. Le … Lire la suite de Résultats variables et individus
Les éléments supplémentaires
Nous avons tenté ensuite tenté de réaliser une ACP des variables en ajoutant des individus supplémentaires. Nous avons installé le package MissMDA qui comporte la fonction impute (PCA). Néanmoins, la fonction nous renvoie des valeurs manquantes (NA) dans les variables quali.sup mois, année et saisons alors que les modalités de ces variables ne comportent pas … Lire la suite de Les éléments supplémentaires