Test

From UnepgridWiki
Revision as of 09:45, 3 October 2024 by Grid-andrea (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search

GRID-Geneva Data Brainstorming

Date : 2 octobre 2024

Heure : 9h00-11h00

Présent.e.s : Hy, Fred, Baher, Yaniss, Pascal, Cédric, Andrea, Jean-Philippe, Thomas, Pierre.

Excusé·e.s : Gregory, Antonio

 

Sujets Echanges (si nécessaire) & décisions (retenues)
1 GRID-Geneva Data infrastructure
Rôles pour la réunion Facilitateur·trice :  Andrea

Scribe :  Pascal

Gardien·ne du temps : Pascal

Retour sur les décisions et actions de la séance précédente (PV précédent) Première séance.
Points à l’ordre du jour (et temps prévu)
Présentation Thomas sur Data Dépôt Structure de la base de données :

Metadata catalogue

Data depository

Data Catalogue

2/3 viennent de Nairobi !

Scripts « ETL» qui téléchargent la donnée, transforme et intègre dans la base de donnée « DataCore ».

Structure de données hétérogène

Environ 50% mis à jour automatiquement

Les indicateurs qui sont utilisés dans Apache Superset sont reformatés.

Basé sur postgres

Buts :

  • Choix des standards (meta données, données, services).
  • Clarifier la terminologie
  • Base de données homogène, une structure pour toutes les données
  • 0% dépendance de Nairobi
  • 100% mis à jour automatiquement (quitte à avoir moins de données au début) et tous les 3-6 mois vérifier les updates pour vérifier ce qui n’est pas automatisable. Dédier 5 jours tous les 3 mois pour s’assurer de l’intégrité des données.
  • Fonction de versioning
Andrea Meta-donnée

SDMX (bien, mais trop lourd)

ISO 19115, attention aux unités, resolution de la donnée…

DCAT with JSON-LD

Data exchange (Open data platform)

Nouvelle norme: SDMX-JSON

Fred: pont entre JSON – Schema et ISO 19115

  • Stat-DCAT (Statistical domain data catalog vocabulary)
  • ADMS (Asset Description Metadata Schema)
  • SDMX (statistical data and metadata exchange)
  • CSVW (CSV on the web)
Fred Propose d’ajouter un module web-client « Stats » pour bénéficier de l’infrastructure MapX.
Cédric Data search

PostgresT

Brocker

Chaque data repository doit fournir un service

Le brocker doit pouvoir découvrir les données à travers un API et un interface utilisateurs. Qui se plug dessus.

Continuer le travail sur le broker déjà initié.

Cédric pourrait fournir ce brocker en trois mois.

Décision Après un tour de table, il est décidé de produire une base de donnée séparée de MapX.

Le but est de combler les lacunes statistiques du GRID-Genève. Une architecture plus souple est requise pour faire face à la diversité des données.

A faire :

  • Choix des standards (meta données, données, services).
  • Clarifier la terminologie
  • Base de données homogène, une structure pour toutes les données
  • 0% dépendance de Nairobi
  • Mise à jour automatiquement (quitte à avoir moins de données au début) et tous les 3-6 mois vérifier les updates pour vérifier ce qui n’est pas automatisable. Dédier 5 jours tous les 3 mois pour s’assurer de l’intégrité des données.
  • Fonction de versioning
  • Connection avec MapX
  • Broker, à voir, peut-être déjà commencer avec les développements search de Cédric, mais avec une page dédiée aux données (p.ex. https://data.unepgrid.ch
Prochaine séance & attribution des rôles tournants Prochaine réunion : jeudi 10 octobre

Facilitateur·trice : Andrea

Scribe :

Gardien·ne du temps : 

 

Tâches/livrables attribué-e-s (1 par ligne) Qui Quand Statut
Planning et timetable Andrea Mardi 8 Oct 0%
Frontend 1er proto Andrea Mercredi 9 octobre 10%
Standard Métadonnées Andrea Jeudi 10-oct 20%