Open Data dans le transport de voyageurs

Le principe de l'Open Data est la mise à disposition de données par des collectivités ou des exploitants. Ces données peuvent ensuite être utilisées pour la création d'applications ou l'analyse statistique. La loi NOTRe (Nouvelle Organisation Territoriale de la République) votée en été 2015 oblige de nombreuses collectivités à publier les informations publiques. Cette disposition va accélérer la mise en ligne de nouvelles données.

Dans le transport, il existe deux types de données : référentiel (stock) et temps réel (flux). Il est possible de stocker les données temps réel, mais le volume peut alors nécessiter de faire appel à une approche de type big data.

Exemples de données

Les informations disponibles sont d'une grande diversité et varient selon leur source :

  • Liste des arrêts avec leur positionnement et leurs équipements
  • Liste des lignes
  • Temps d'attente avant le prochain bus par arrêt
  • Localisation des dépositaires
Horaires des bus de Nantes
Exemple de données : horaires des lignes de bus de Nantes au format Neptune (XML).

Sources de données

La démarche OpenData est assez simple à mettre en oeuvre, les fournisseurs de données sont divers.

Exploitants

La SNCF a ouvert un site dédié aux données qu'elle met à disposition : http://data.sncf.com (horaires, équipements, gares…). La RATP a également son propre site dédié (http://data.ratp.fr). On y trouve des données comme les correspondances stations/lignes, l'offre transport, la qualité de l'air mesurée dans les stations… Keolis Rennes (réseau STAR) propose des données depuis début 2010 : http://data.keolis-rennes.com. Dans les Bouches-du-Rhône, de nombreux réseaux proposent leurs données sur le site Lepilote.

Autorités organisatrices

Les données transport étant fortement liées à l'exploitation du réseau (notamment pour le temps réel), les collectivités, en tant qu'autorités organisatrices, se limitent généralement à la publication des données relatives aux infrastructures : réseau routier, accessibilité des arrêts de bus…

Communauté

Les données peuvent également être publiées par tous sur des sites collaboratifs comme la base de donnée cartographique OpenStreetMap.

Des outils comme Jungle Bus permettent d'ajouter à la base des arrêts de transport collectif directement depuis un smartphone.

Diffusion des données

Au niveau national, Etalab (service du Premier Ministre) administre le site internet http://www.data.gouv.fr, véritable catalogue des données publiques. Un moteur de recherche permet de cibler les données souhaitées. Le portail Passim du ministère de l'environnement, de l'énergie et de la mer compile les informations liées à l'opendata.

Les données publiées peuvent être disponibles directement chez leur producteur ou sur une plate-forme mutualisée.

Des initiatives locales ou thématiques référencent les données disponibles sur des portails.

Actualisation

Les jeux publiés doivent être régulièrement actualisés, notamment les fichiers qui contiennent les horaires, sinon il ne sera pas possible aux réutilisateurs de fournir des informations.

Accès aux données

Une partie des données pouvant évoluer régulièrement (parfois en temps réel). Certaines plateformes proposent des interfaces de programmation (API) permettant aux développeurs d'accèder facilement aux dernières données.

Présentation des données

La mise en ligne va de la simple publication de fichiers à télécharger, jusqu'à des interfaces élaborées. Pour valoriser les éléments publiés et encourager leur réutilisation, il est important de bien présenter et de documenter (via les métadonnées) les jeux de données. Des solutions permettent de les explorer directement sous forme de tableaux, de graphiques ou de cartes, sans avoir à les télécharger. La société OpenDataSoft s'est spécialisée dans cette activité.

Format des données

En fonction du type de données, plusieurs formats existent. Les données horaires sont la plupart du temps disponibles au format GTFS (General Transit Feed Specification, format initialement développé par Google), plus rarement au format Neptune. Les autres données sont souvent proposées au format CSV, XML, JSON ou parfois Excel.

Liste des arrêts du réseau STAR
Exemple de données : liste des arrêts du réseau STAR (Rennes) au format CSV.

Pour les coordonnées, il existe deux formats : WGS84 et Lambert II.

Le CERTU est éditeur d'un site internet présentant un panorama des normes existantes concernant les données sur l'offre de transport collectif : http://www.normes-donnees-tc.org

Utilisation des données

Les données sont publiées avec une licence : l'analyse de ce document juridique permet de savoir de quelle manière elles peuvent être utilisées.

API

Navitia.io (CanalTP) agrège ces données et permet de les utiliser, par exemple pour calculer des itinéraires. Ce service propose une API facilitant la réutilisation des données.

Applications mobiles

A partir des données mises à disposition, des applications sont créées par des tiers. Dans de nombreux cas, ces applications sont des moteurs de recherche d'itinéraires multimodaux (avec ou sans géolocalisation).

Ces applications sont disponibles en téléchargement sur les stores : Google Play, App Store…

Sites internet

Le projet OSMTransport basé sur OpenStreetMap (OSM) cartographie l'ensemble des réseaux de transport public. Les données intégrées dans OSM peuvent à leur tour être réutilisées.

Mais ces données transport sont parfois incluses dans des domaines totalement différents (immobilier, accessibilité…).

Les données publiées peuvent être utilisées par des acteurs locaux ou bien par des géants du web.


A consulter également

Pour en savoir plus, consultez également les dossiers suivants sur le même thème :

Partager cet dossier :

Actualité sur ce sujet