La donnée, nouvel or noir pour la mobilité ?



Une masse de donnée en hyper croissance

Les données sont omniprésentes dans le domaine de la mobilité. Leurs natures sont d’une grande diversité en fonction des moyens de recueil. L’offre de transport est appréhendée à travers la définition géomatique des réseaux routiers (OSM, OpenStreetMap), des réseaux de transport en commun (GTFS), de l’offre de stationnement ou la position des bornes de recharge pour véhicules électriques (Izivia). Des comptages automatiques renseignent sur les volumes de trafic à certains points du réseau routier, des enquêtes localisées apportent une information sur les origines et destinations des individus. Le déploiement massif des smartphones et des GPS augmente continuellement le nombre de véhicules traceurs (FCD, Floating Car Data ou FMD, Floating Mobile Data) qui permettent la géolocalisation des véhicules, qu’ils soient personnels ou appartenant à des flottes de véhicules des nouveaux services à la mobilité. Ces données de localisation produisent elles-mêmes de nouvelles informations que sont les cartes traficolor (Google Maps) ou des temps de parcours sur des itinéraires. Des modèles numériques comme les modèles de déplacement peuvent également être générateurs de données comme les matrices origines-destinations de zone à zone. Ceux-ci sont également alimentés par des données socio-économiques produites par l’INSEE sur la base du recensement de la population et des lieux d’activité. La composition du parc de véhicules est également une information précieuse qu’il est possible de récupérer, par exemple grâce aux fichiers des cartes grises. Les types de véhicules sont fortement liés au niveau de pollution émis, qu’il est possible de mesurer grâce à des capteurs atmosphériques. On le comprend, des données aussi nombreuses que variées, dont le nombre croit de jour en jour. Dans ce contexte, il est légitime de parler de Big data.


Des données commerciales ou ouvertes ?

L’accessibilité des données est un enjeu majeur pour les acteurs de la mobilité. Il existe pratiquement autant de fournisseurs que de types de données. Pour autant, on peut segmenter les données en deux grandes catégories:


(1) La donnée commerciale : elle est produite (recueillie, archivée, traitée) et diffusée par des fournisseurs privés. Ils peuvent être des gestionnaires d’infrastructures de transport (routes, autoroutes, aéroports...), opérateurs publics et privés de services de transport (transport en commun ou à la demande, flottes de taxis ou de vélos en libre-service), des constructeurs automobiles (véhicules connectés), des opérateurs de téléphonie mobile (Orange...), opérateurs de services numériques (Apple, Google, Waze, Coyotte... ) ou des agrégateurs de données multi-source (Tomtom , Here Technologies...). Dans cette catégorie, la donnée est accessible auprès du fournisseur via un modèle commercial payant, et d’un point de vue technique généralement accessible via des API avec une dimension qualité de service et de disponibilité très forte. Il peut s’agir à la fois d’accès en temps réel ou d’accès sur des jeux de données historiques .


(2) La donnée ouverte : c’est-à-dire des données collectées ou dont la propriété est souvent celle des collectivités publiques, villes et métropoles, autorités organisatrices de mobilité (AOM), services de l’Etat, et établissements publics. En France, depuis la loi Le Maire sur l’Open Data, les données publiques sont ouvertes, ce qui signifie une accessibilité pour tous, et leur gratuité. Depuis, La Loi d’Orientation des Mobilités (article 25) est venue compléter cette vision en prévoyant l’ouverture des données de mobilité. D’ailleurs, dans ce cadre, une nouvelle licence, la licence Mobilités, a vu récemment le jour pour encadrer leur usage dans les services numériques de mobilité afin qu’ils soient toujours plus respectueux de l’intérêt général.

Pour autant, faire en sorte que l’ensemble des données publiques de mobilités soient defacto ouvertes, reste une opération complexe. On peut en effet distinguer les données récurrentes (dont les modes de recueils sont permanents), et les données ponctuelles (recueillies temporairement à l’occasion de grands projets ou d’événements particuliers). Il est plus aisé pour l’acteur public de publier les données qu’il a l’habitude de manipuler et qui sont souvent intégrées dans un processus numérique automatisé (même si la question de l’interopérabilité des formats se pose), tandis que la question de l’hétérogénéité des formats, du manque de standardisation dans les référentiels et de la diversité géographique et temporelle des séries de données ponctuelles pose la question de l’utilité économique et collective de l’ouverture de ces données.


Des applications variées

Dans tous les domaines, l’engouement autour des données est réel. Le secteur de la mobilité n’échappe pas à cette tendance de fond : la donnée devient l’or noir de nombreux usages et applications, et pas uniquement dans le champ du grand public.


(1) Elles permettent tout d’abord de comprendre le passé, par exemple en rejouant des situations dont les informations ont été historisées. Le développement technologique apporte de nouveaux moyens pour faire parler ces données, on parle entre autres d’intelligence artificielle et de science de la donnée (par ex, statistiques, machine learning). Faire de la classification (apprentissage automatique non-supervisé – clustering) permet d’extraire des schémas de mobilité récurrent. Des métriques (statistiques, KPI), permettent d’évaluer les performances passées pour connaître le potentiel d’amélioration. Des analyses statistiques renseignent sur des corrélations entre les jeux de données, et fournissent des éléments pour déduire des causalités, mais attention, corrélation n’implique pas causalité ! C’est bien le rôle des observatoires de la mobilité qui sont régulièrement mis à jour par les collectivités et leurs prestataires.


(2) Elles permettent de suivre le présent, à travers du monitoring. On connaît en temps réel (cliché instantané) ce qui se passe sur le réseau de transport ou dans le service de mobilité, ce qui rend possible la supervision des opérations d’exploitation.

(3) Elles permettent de se projeter dans le futur : pour la prévision court terme, généralement dans un horizon pouvant aller de 15 min à 3h, on recourt à des techniques de machine learning (apprentissage automatique supervisé comme les réseaux de neurones, les modèles de régression, catégorisation), ou des modèles physiques (calculs de flux, simulation). La projection plus long terme, est également concernée dans les actions de planification comme les projets d’aménagement d’infrastructure, de régulation, d’intégration de nouveaux systèmes de mobilité. Pour étudier leurs impacts systémiques, on a souvent recours à la mise en place de modèle (jumeaux numériques).


Un usage intensif mais différentié

Aujourd’hui, tous les acteurs du secteur de la mobilité sont des consommateurs intensif de données. Mais les usages et les bénéfices tirés de la données sont extrêmement variés selon les utilisateurs et métiers. On citera les quelques exemples ci-après :

  • Les collectivités, qui doivent appuyer les politiques locales impulsées par leurs élus ;

  • Les exploitants de réseau (routiers, transports publics, etc.), dont les enjeux de monitoring sont quotidiens, et les besoins d’évaluation de projets réguliers.

  • Les sociétés d’ingénierie et de conseil, qui évaluent les projets pour le compte des Maîtres d’Ouvrage et exploitants de réseaux.

  • Les éditeurs de logiciels métier, ainsi que les chercheurs, qui doivent élaborer modèles et méthodes efficaces et génériques, pour améliorer les process de l’ensemble des acteurs du système.


Quels enjeux à venir ?

L’accessibilité des données et leur partage ne devient pas réalité par de simples déclarations. Un travail en amont et en aval est nécessaire. Pour ce qui est de l’accès aux données, es portails open data se multiplient, mais la profondeur de leur catalogue les rends difficilement lisibles et complexifie l’exploitation des jeux de données mis à disposition. Les données commerciales sont couteuses et les modèles économiques ne sont pas toujours simples à comprendre. La donnée commerciale est déjà accessible avec des technologies robustes. Elle demande à présent une mise en visibilité par des acteurs de référence (comme la plate-forme France Mobilité, transport.data.gouv.fr), et un éclairage sur les politiques tarifaires pour en systématiser l’usage.


La donnée ouverte dispose de tout un dispositif règlementaire et juridique d’encadrement de son usage. Il serait à présent souhaitable de disposer d’un cadre technique pour appuyer les fournisseurs publics de données dans la digitalisation de leur processus de mise à disposition de leurs données en OpenData. Cela concerne entre autres, l’élargissement de l’élaboration et la mise en place de normes adaptée à chaque type de données (comme cela est déjà fait par exemple avec DATEX 2 pour la donnée de trafic routier, ou GTFS, initié par Google, pour les transports en commun et le parking). La construction d’une gouvernance adaptée (locale, territoriale, nationale) est également une question fondamentale pour la capitalisation, la mutualisation, le partage de la donnée entre acteurs voisins et complémentaires. Cette question doit d’ailleurs intégrer l’identification d’acteurs publics de référence pour agréger les bases de données des collectivités, et diffuser la donnée à une échelle la plus globale possible (par ex l’INSEE, le Cerema, l’IGN, …).


Tous les acteurs de la mobilité ont intérêt à travailler efficacement et main dans la main pour tirer une valeur optimale de la donnée de mobilité. L’enjeu c’est que tous les acteurs soient alignés avec l’intérêt collectif de transition vers une mobilité plus vertueuse, plus sûre, plus fluide, plus respectueuse de l’environnement, et plus décarbonée.


Vous souhaitez découvrir comment tirer parti de vos données de mobilité avec Neovya Hubsim ?
Engagez la conversation avec un expert ➜ Planifier un rdv !