Première rencontre technique avec l'IGN

Ce matin Gaël, Vincent, Marc et moi étions à l'IGN pour une première rencontre technique.

C'est suite à la rencontre avec la direction de l'IGN de ces dernières semaines que nous avons lancé cette série de réunions technique pour mieux nous connaitre, mieux connaître nos façons de faire, nos outils, nos problèmes respectifs.
 
Donc ce coup-ci c'était l'IGN qui nous montrait quelques outils et nous recevait dans ses locaux.
 
Nous avons commencé par un outil d'appariement qui permet de retrouver les objets similaires dans deux bases. Cet appariement se fait sur le plan géométrique et a été développé à l'origine pour compléter les données sémantiques d'une base riche géométriquement mais pauvre sémantiquement avec les données sémantique de l'autre base plus riche mais plus pauvre sur le plan géométrique (ça va vous suivez ?).
 
Pour nous ça donnerai par exemple :
- la BD Carthage : avec des noms, des ref:sandre potentiels, de la navigabilité mais une géométrie moins détaillées que...
- les données OSM avec des cours d'eau tracés mais sans tout cette sémantique (nos tags) qu'on pourrait ajouter
 
Pour cela un sur-découpage du filaire est fait pour faire correspondre des éléments qui ne sont pas tronçonnés de la même façon car autant apparier du ponctuel est relativement simple autant pour du filaire ou du surfacique ça se complique très vite !
 
L'exemple montré était assez intéressant, une zone sur Haïti avec des données OSM et d'autres données et comment réconcilier tout ce petit monde.
 
Ca tourne dans GéoConcept, donc même si l'IGN peut éventuellement mettre ça en opensource, c'est dépendant d'un logiciel propriétaire.
 
Les principes sont proches d'une thèse que j'avais lu sur le sujet: http://recherche.ign.fr/labos/cogit/pdf/THESES/DEVOGELE/These_Devogele_1997.pdf
 
L'appariement peut aussi être fait sur des éléments surfaciques et a été utilisé pour intégrer le bâti du cadastre dans la BDUni (la base "mère" de l'IGN).
 
Le plus difficile à apparier, ce sont des données avec des géométries prévues pour des échelles très différentes ou lorsque la topologie est différente car l'outil semble aussi s'appuyer sur un graphe pour les données filaires.
 
 
Deuxième outil dont on a juste parlé, c'est un générateur de "diff". On lui donne 2 bases et il sort ce qui est en plus ou différent, ce qui a disparu, mais aussi les fusions/tronçonnages ou les fausses modifs (suppression/ajout du même élément). Ca se base sur des ID d'objet et aussi une comparaison géométrique mais très serrée (par comme pour l'appariement). Outil intéressant qui devrait être mis en opensource (CECIL-C) sans trop de difficulté. C'est écrit en C et tourne sous Windows, Linux et OSX.
 
 
Troisième outil, c'est le futur outil de remontée d'erreurs basé sur une interface web qui permet d'accèder directement aux données de la BDUni (de la veille) un peu comme avec iD. L'avantage c'est qu'on modifie directement les attributs des objets et qu'on accède aux objets présents en base mais aussi on peut rendre visible ceux supprimés ainsi que les colorer selon leur date de dernière mise à jour.
 
Prochaine réunion technique en janvier, ce coup là c'est l'IGN qui viendra nous voir à La Fonderie, sûrement avec quelques "collecteurs" qui tournent sur le terrain. On a en effet parlé de GoPro, d'outils de saisie, de suivi des modifs de données, mais aussi d'outil de contrôle à priori (façon "validator" de JOSM) que l'IGN a dans ses outils, mais il ne semble pas y avoir d'équivalent à osmose.
 
A ce sujet, j'ai lancé l'idée de définir des règles de cohérences sous forme de scripts génériques non liés à un outil ou des formats de données pour par exemple décrire des choses comme: un bureau de poste est soit ponctuel, soit d'une surface comprise entre 10 et 500m2.
 
C'est une idée qui m'était venue pendant l'exposé d'une autre thèse lors de la journée OSM au CRAIG: http://recherche.ign.fr/labos/cogit/pdf/THESES/BRANDO/M%C3%A9moire_de_Th%C3%A8se-Carmen_Brando_Escobar_2013.pdf