Open Data dans le transport de voyageurs

L'Open Data est la mise à disposition publique de données par des collectivités ou des exploitants. Ces données peuvent ensuite être utilisées pour la création d'applications ou l'analyse statistique.

Dans le transport, il existe deux types de données : référentiel (stock) et temps réel (flux). Il est possible de stocker les données temps réel pour pouvoir ensuite effectuer des analyses statistiques. Le fort volume de données peut nécessiter l'utilisation de technologies de type big data.

La loi NOTRe (Nouvelle Organisation Territoriale de la République) votée en 2015 oblige de nombreuses collectivités à publier les informations publiques. L'ouverture s'est effectuée en plusieurs étapes. Cette disposition a accéléré la mise en ligne de nouvelles données, mais tous les réseaux de transport public ne publient pas encore leurs données en open data.

Données

Les informations disponibles sont d'une grande diversité et varient selon leur source :

  • Liste des arrêts avec leur positionnement et leurs équipements
  • Liste des lignes
  • Temps d'attente avant le prochain bus par arrêt
  • Localisation des dépositaires
Horaires des bus de Nantes
Exemple de données : horaires des lignes de bus de Nantes au format Neptune (XML).

Le CERTU est éditeur d'un site internet présentant un panorama des normes existantes concernant les données sur l'offre de transport collectif : http://www.normes-donnees-tc.org

Données théoriques

Il s'agit de la description de l'offre de transport (arrêts, lignes, horaires théoriques, tarification…).

Ces données sont produites par les logiciels de conception de l'offre de transport.

Les données horaires sont la plupart du temps disponibles au format GTFS (General Transit Feed Specification, format initialement développé par Google), plus rarement au format Neptune (NeTEx).

Pour les coordonnées, il existe deux formats : WGS84 et Lambert II.

Données temps réel

La publication des données en temps réel (ex : prochains passages à un arrêt) nécessite d'avoir un système embarqué à bord des véhicules : SAEIV, boîtier connecté ou téléphone mobile.

Les données des véhicules remontent dans un concentrateur qui les rediffuse au format GTFS-RT ou SIRI (Service Interface for Real time Information).

Lorsque plusieurs types de systèmes embarqués existent et que la volonté est de diffuser un seul flux, des solutions d'agrégation existent.

Ce flux intègre également l'info trafic (service alerts) : déviations, arrêts non desservis…

Autres données

D'autres données peuvent être publiées, comme des statistiques de fréquentation.

Ces données sont souvent proposées au format CSV, XML, JSON ou parfois Excel.

Liste des arrêts du réseau STAR
Exemple de données : liste des arrêts du réseau STAR (Rennes) au format CSV.

Diffusion des données

Au niveau national, Etalab (service du Premier Ministre) administre le site internet https://www.data.gouv.fr, véritable catalogue des données publiques. Un moteur de recherche permet de cibler les données souhaitées. En 2018, un site dédié aux données transport a été mis en ligne. Le Le Point d'Accès National aux données de transport regroupe les jeux de données disponibles : https://transport.data.gouv.fr/datasets. Le portail Passim du ministère de l'environnement, de l'énergie et de la mer compile les informations liées à l'opendata.

Les données publiées peuvent être disponibles directement chez leur producteur ou accessibles sur une plate-forme mutualisée.

Exploitants

La SNCF a ouvert un site dédié aux données qu'elle met à disposition : http://data.sncf.com (horaires, équipements, gares…). La RATP a également son propre site dédié (http://data.ratp.fr). On y trouve des données comme les correspondances stations/lignes, l'offre transport, la qualité de l'air mesurée dans les stations… Keolis Rennes (réseau STAR) propose des données depuis début 2010 : https://data.explore.star.fr. Sur le territoire de la Métropole Aix-Marseille-Provence, les données des réseaux de transport public sont publiées sur le site Lepilote.

Autorités organisatrices

Les données transport étant fortement liées à l'exploitation du réseau (notamment pour le temps réel), les collectivités, en tant qu'autorités organisatrices, se limitent généralement à la publication des données relatives aux infrastructures : réseau routier, accessibilité des arrêts de bus…

Communauté

Les données peuvent également être publiées par tous sur des sites collaboratifs comme la base de donnée cartographique OpenStreetMap.

Des outils comme Jungle Bus permettent d'ajouter à la base des arrêts de transport collectif directement depuis un smartphone.

Actualisation

Les jeux publiés doivent être régulièrement actualisés, notamment les fichiers qui contiennent les horaires, sinon il ne sera pas possible aux réutilisateurs de fournir des informations.

Accès aux données

La mise en ligne va de la simple publication de fichiers à télécharger, jusqu'à des interfaces élaborées. Pour valoriser les éléments publiés et encourager leur réutilisation, il est important de bien présenter et de documenter (via les métadonnées) les jeux de données. Des solutions permettent de les explorer directement sous forme de tableaux, de graphiques ou de cartes, sans avoir à les télécharger. La société OpenDataSoft s'est spécialisée dans cette activité.

Une partie des données pouvant évoluer régulièrement (parfois en temps réel). Certaines plateformes proposent des interfaces de programmation (API) permettant aux développeurs d'accéder facilement aux dernières données.

Qualité des données

Des outils de validation permettent aux producteurs de données de s'assurer que les données publiées sont sans erreur et respectent les normes.

La bonne qualité des données est essentielle pour que les réutilisateurs puissent fournir des résultats fiables.

Réutilisation des données publiées en open data

Les données sont publiées avec une licence : l'analyse de ce document juridique permet de savoir de quelle manière elles peuvent être utilisées. Une compensation financière peut être demandée en fonction du nombre de requêtes effectuées par minute et/ou par jour.

Ces données sont réutilisées par des acteurs locaux ou bien par des géants du web. Elles sont parfois incluses dans des domaines totalement différents (immobilier, accessibilité…).

API

Navitia.io (Hove, ex-Kisio Digital, ex-CanalTP) agrège ces données et permet de les utiliser, par exemple pour calculer des itinéraires. Ce service propose une API facilitant la réutilisation des données.

Applications mobiles

A partir des données mises à disposition, des applications sont créées par des tiers. Dans de nombreux cas, ces applications sont des moteurs de recherche d'itinéraires multimodaux (avec ou sans géolocalisation) destinés à l'information voyageurs en temps réel.

Ces applications sont disponibles en téléchargement sur les stores : Google Play, App Store…

Sites internet

Le projet OSMTransport basé sur OpenStreetMap (OSM) cartographie l'ensemble des réseaux de transport public. Les données intégrées dans OSM peuvent à leur tour être réutilisées.

Contrôle

L'Autorité de régulation des transports (ART) est dotée d'une mission de contrôle concernant la mise à disposition des données.

En juin 2022, l'ART a publié le premier état des lieux de l'ouverture et de l’utilisation des données de mobilité. L'analyse a été faite à partir des données publiées sur le PAN à la date du 1er mars 2022. Il s'avère qu'un tiers des jeux de données n'était pas à jour. La qualité est jugée satisfaisante permettant une réutilisation par des applications de mobilité. Enfin, l'autorité note un manque de transparence dans la manière dont les applications de mobilité classent les trajets proposés aux voyageurs.

Pour en savoir plus…

La démarche OpenData est assez simple à mettre en oeuvre, plusieurs sociétés proposent outils et services pour y parvenir.

Voici les principaux sites à consulter sur ce sujet :

Partager ce dossier :

A consulter également

Pour en savoir plus, consultez également les dossiers suivants sur le même thème :


Dernières actualités sur ce sujet