Test

GRID-Geneva Data Brainstorming

Date : 2 octobre 2024

Heure : 9h00-11h00

Présent.e.s : Hy, Fred, Baher, Yaniss, Pascal, Cédric, Andrea, Jean-Philippe, Thomas, Pierre.

Excusé·e.s : Gregory, Antonio

Sujets	Echanges (si nécessaire) & décisions (retenues)
1	GRID-Geneva Data infrastructure
Rôles pour la réunion	Facilitateur·trice : Andrea Scribe : Pascal Gardien·ne du temps : Pascal
Retour sur les décisions et actions de la séance précédente (PV précédent)	Première séance.
Points à l’ordre du jour (et temps prévu)
Présentation Thomas sur Data Dépôt	Structure de la base de données : Metadata catalogue Data depository Data Catalogue 2/3 viennent de Nairobi ! Scripts « ETL» qui téléchargent la donnée, transforme et intègre dans la base de donnée « DataCore ». Structure de données hétérogène Environ 50% mis à jour automatiquement Les indicateurs qui sont utilisés dans Apache Superset sont reformatés. Basé sur postgres Buts : Choix des standards (meta données, données, services). Clarifier la terminologie Base de données homogène, une structure pour toutes les données 0% dépendance de Nairobi 100% mis à jour automatiquement (quitte à avoir moins de données au début) et tous les 3-6 mois vérifier les updates pour vérifier ce qui n’est pas automatisable. Dédier 5 jours tous les 3 mois pour s’assurer de l’intégrité des données. Fonction de versioning
Andrea	Meta-donnée SDMX (bien, mais trop lourd) ISO 19115, attention aux unités, resolution de la donnée… DCAT with JSON-LD Data exchange (Open data platform) Nouvelle norme: SDMX-JSON Fred: pont entre JSON – Schema et ISO 19115 Stat-DCAT (Statistical domain data catalog vocabulary) ADMS (Asset Description Metadata Schema) SDMX (statistical data and metadata exchange) CSVW (CSV on the web)
Fred	Propose d’ajouter un module web-client « Stats » pour bénéficier de l’infrastructure MapX.
Cédric	Data search PostgresT Brocker Chaque data repository doit fournir un service Le brocker doit pouvoir découvrir les données à travers un API et un interface utilisateurs. Qui se plug dessus. Continuer le travail sur le broker déjà initié. Cédric pourrait fournir ce brocker en trois mois.
Décision	Après un tour de table, il est décidé de produire une base de donnée séparée de MapX. Le but est de combler les lacunes statistiques du GRID-Genève. Une architecture plus souple est requise pour faire face à la diversité des données. A faire : Choix des standards (meta données, données, services). Clarifier la terminologie Base de données homogène, une structure pour toutes les données 0% dépendance de Nairobi Mise à jour automatiquement (quitte à avoir moins de données au début) et tous les 3-6 mois vérifier les updates pour vérifier ce qui n’est pas automatisable. Dédier 5 jours tous les 3 mois pour s’assurer de l’intégrité des données. Fonction de versioning Connection avec MapX Broker, à voir, peut-être déjà commencer avec les développements search de Cédric, mais avec une page dédiée aux données (p.ex. https://data.unepgrid.ch
Prochaine séance & attribution des rôles tournants	Prochaine réunion : jeudi 10 octobre Facilitateur·trice : Andrea Scribe : Gardien·ne du temps :

Tâches/livrables attribué-e-s (1 par ligne)	Qui	Quand	Statut
Planning et timetable	Andrea	Mardi 8 Oct	0%
Frontend 1^er proto	Andrea	Mercredi 9 octobre	10%
Standard Métadonnées	Andrea	Jeudi 10-oct	20%

Test

Navigation menu

Search