BANO ? BANCO !

Qu'est-ce que BANO ?
Il s'agit donc de constituer une base d'adresses composite à partir des meilleures sources disponibles (et libres).
L'objectif est de proposer une couverture la plus étendue possible, la plus homogène possible.
Bien sûr à son démarrage BANO ne sera pas exhaustive, ni parfaite (quelles données sont parfaites ?) et fonctionnera dans l'esprit "release early, release often" cher au monde de l'open-source.
Il s'agit donc d'un projet ouvert et collaboratif ou toutes les bonnes volontés sont les bienvenues pour apporter des données, des outils, du code, des ressources matérielles, de la matière grise !
 
Comment est-elle constituée ? A partir de quelles sources ?
Tout d'abord ce sont les données OpenStreetMap collectées sur le terrain par des centaines, des milliers de contributeurs qui sont utilisées. Ce choix peut paraitre étonnant, mais c'est potentiellement la source la plus à jour et la plus réactive aux changements comme nous allons le voir un peu plus loin. Elle est donc prioritaire sauf exception et son volume est d'environ 2 millions d'adresses à mai 2014.
 
Ensuite vient une deuxième source, trop rare (petit appel du pied), mais souvent de qualité: ce sont les données en opendata. Leur volume estimé est d'environ 1 million d'adresses (mai 2014).
 
A ces données déjà disponibles en opendata, nous ajouterons les données versées dans BANO par les organismes producteurs de données voulant les partager mais qui ne les ont pas encore mises en opendata. C'est par exemple le cas de nombreux SDIS (petit appel du pied au passage).
 
Pour compléter, ce sont les adresses collectées à partir du cadastre vectoriel qui seront utilisées. Celui-ci couvre 80% des communes et 87% de la population.
 
Quels rapprochements entre les sources ?
Le rapprochement des différentes sources est fait régulièrement afin de produire la base composite.
Il est trop tôt pour dire à quelle fréquence elle sera produite, potentiellement quotidiennement si les ressources matérielles le permettent (2ème petit appel du pied).
Un contrôle de qualité pourra être fait pendant cette phase de rapprochement pour identifier les adresses avec une trop grande différence ou un manque de rapprochement. Ceci n'est pas encore le cas dans les premiers fichiers produits.
 
Quels enrichissements ?
Ce rapprochement permet par exemple sur les sources opendata ou cadastre d'étendre les adresse dans leur forme complète, accentuée, sans abbréviations et comprenant majuscules et minuscules. Ceci correspond aux préconisations du CNIG dans son rapport final sur l'adresse.
C'est la règle utilisée en France dans OpenStreetMap, mais malheureusement non généralisée en opendata. Le cadastre quant à lui est à l'opposé (toponymes abbrégés, en majuscule non accentués).
 "AV DU MAL LECLERC" deviendra donc dans la mesure du possible "Avenue du Maréchal Leclerc"... finit le style MINITEL 80s. Pour cela il suffit de correctement nommer la voirie dans OSM, les scripts de rapprochement de BANO faisant le reste entre les sources d'adresses, le fichier FANTOIR de la DGFiP (en opendata) et OSM.
 
Comment améliorer et corriger les adresses de BANO ? 
Les données géographiques sont en perpétuelles changement car le terrain qu'elles tentent de décrire aussi exactement possible est en perpétuel changement. Telle nouvelle rue est percée, rallongée, change de nom.
Le CNIG estimait (en 2002) à 200.000 le nombre de nouvelles adresses créées annuellement. Il reste encore de nombreuses communes rurales où l'adressage intégral n'est pas réalisé mais progresse.
 
Initialement, pour corriger et améliorer ces données, il suffira donc de le faire dans OpenStreetMap, qui sera pris en priorité sur les autres sources. Les outils sont déjà disponibles et ils s'appuient sur une infrastructure existante, stable, maintenue. C'est donc une plateforme immédiatement disponible pour les acteurs qui veulent collaborer (services de l'État, collectivités, entreprises, etc ). Toute amélioration profitera donc et à la BANO et à OSM, d'une pierre deux coups.
 
Dans un deuxième temps, un outil plus centré sur l'adresse devrait pouvoir être aussi mis en place pour simplifier ce processus de signalement, correction et amélioration sans passer par les outils d'édition classiques d'OpenStreetMap (eéditeur en ligne iD et éditeur lourd JOSM).
 
Quelle licence pour les données BANO ?
La BANO s'appuyant en partie sur des données sous licence ODbL (par exemple OSM et certains jeux en opendata), elle sera naturellement publiée sous licence ODbL.
Cette licence impliquera donc de citer la source et de partager toute amélioration ou enrichissement de celle-ci. Cette clause de partage à l'identique garantit que les données de BANO et leurs améliorations seront toujours d'accès libre.
Ceci ne devrait poser aucun problème aux services publics, qui n'ont aucun intérêt à ne pas partager les améliorations, bien au contraire, ça leur évitera de faire le travail en double, triple, voire plus ! 
La licence ODbL n'empêche pas les usages commerciaux, BANO est donc aussi ouverte pour le monde de l'entreprise, dans le respect de l'attribution et du partage à l'identique bien sûr.
 
Quelles échéances ?
Dans mon précédent billet un des chapitre s'intitulait "A comme Action".
BANO a démarré il y a déjà quelques mois pour la partie codage des scripts de collecte, de rapprochement, de cumul et d'export. Le premières collectes ont démarré pendant le pont du 8 mai dernier.
BANO a accumulé à ce jour (19 mai 2014) plus de 12,5 millions d'adresses à partir des 3 sources initiales (OSM + opendata + cadastre).
A la fin de la collecte initiale (prévue d'ici une à deux semaines), la BANO devrait cumuler environ 25 millions d'adresses à partir des différentes sources, la moitié du chemin a donc été parcouru en une dizaine de jours.
Le statut (en temps réel) du contenu de BANO est disponible sur: outils/bano/status
Un rendu cartographique permet de visualiser la couverture de BANO: http://tile.openstreetmap.fr/~cquest/leaflet/bano.html
 


Voir sur une carte plus grande


Des données déjà disponibles
Les premiers fichiers expérimentaux sont déjà disponibles pour une soixantaine de départements sur: http://bano.openstreetmap.fr/data/
Votre retour concernant ces premiers fichiers est attendu et souhaité en gardant bien à l'esprit qu'il s'agit d'un premier export expérimental dans une logique "release early, release often".
Vous pouvez faire vos remontées via:


BANO et l'intégration d'adresses dans OpenStreetMap
Un point important pour les contributeurs OpenStreetMap: BANO n'est pas destinée à être une source pour OpenStreetMap, car BANO s'appuie sur les données OSM pour créer une base composite à partir de différentes sources.
Ce sont les sources d'origine qu'il faut utiliser pour intégrer des données adresse dans OSM, c'est à dire http://addr.openstreetmap.fr pour les sources en opendata et http://cadastre.openstreetmap.fr pour les extractions à partir du cadastre.


On résume...

BANO est un projet ouvert, libre, collaboratif pour consistuer une Base d'Adresses Nationale Ouverte la plus complète et à jour possible.
BANO est une réalité, les premiers fichiers (expérimentaux) sont déjà disponibles pour une soixantaine de départements.
BANO a besoin pour avancer (appels du pied):

  • de données complémentaires (SDIS, collectivités locales, autres acteurs de terrain)
  • d'améliorations des données déjà collectées
  • de ressources matérielles, humaines
  • de vos remontées sur le projet, sur les premiers fichiers expérimentaux

 

Commentaires

Vous y avez sans doute déjà pensé ... le fichier des mairies et différents organismes publics contient plus de 60000 adresses géocodées. Il semble qu'elles ne soient pas toutes dans OSM ou dans BANO (j'ai étudié les couple INSEE / CP dans la BDD BANO, j'en ai trouvé 5615; plus de 6000 après avoir éliminé les CEDEX et BP, dans le fichier des organismes; vérification faite avec les fichiers de la poste, il ne manquerait que 6 CP dans le fichier des organismes ...)
Portrait de webmaster

Le problème est la qualité du géocodage qui a été fait sur ce fichier des services publics et comment il a été fait. Par contre, la simple adresse postale est déjà un renseignement utile pour vérifier l'exhaustivité de BANO et là tout type de fichier est intéressant pour ça, y compris les "résidus" de géocodage effectués avec BANO. N'hésitez pas à nous contacter sur bano@openstreetmap.fr !

Bonjour, Responsable SIG d'une commune du Nord, je suis en charge de la mise à jour des voies et numéro de voirie de ma commune. Étant rattaché à la Direction de l'Urbanisme, tous les arrêtés de dénominations et de numérotation passe par mon bureau. J'ai récupéré bano-59 en shp pour le mettre à jour et pour m'en servir comme référentiel. A chaque nouvelle adresse créée, j'ai précisé CLL dans le champ source. Comment puis je vous retourner ces modifications ? Merci et bravo pour ce travail !

guyom