A partir des 6442 gares présentes dans le fichier des "gares exploitées ou non" déposé sur data.gouv (Source: https://www.data.gouv.fr/fr/datasets/gares-ferroviaires-de-tous-types-exploitees-ou-non/), plusieurs opérations on été réalisées :
(1) vérification des données : confrontation des coordonnées géographiques et des toponymes (lorsque possible) qui a permis de relever un pourcentage faible d'erreurs, mais tout de même un peu plus d'une centaine (concentrée sur quelques lignes);
(2) confrontation avec un fichier présent sur (ressources.data.sncf.com), qui permet d'améliorer encore la fiabilité des données;
(3) enrichissement avec les gares qui ne sont plus en service sur les lignes encore en fonctionnement et surtout avec celles des lignes qui ne sont plus en service.
Au total, environ 12000 gares (estimé à 90% du total réel);
(4) une adaptation des propriétés du format GeoJson, et un classement systématique des gares par numéro de ligne et selon l'ordre croissant de leur PK (point kilométrique sur cette ligne).
(5) reste à faire : confrontation a posteriori des coordonnées des gares et des communes (en cours), exploitation du graphe des connections (en cours).
(6) exemple de réutilisation du fichier en visualisation interactive, à cette adresse : http://bigbugdata.com/eurorail
0
0