-
Notifications
You must be signed in to change notification settings - Fork 16
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Gestion des identifiants des datasets issus d'un CKAN et d'un catalogue #780
Comments
En effet. Nous avons réglé ce problème avec le moissonneur ODS en ignorant les métadonnées issues d'ISO 19139. Celles-ci transitent donc exclusivement via geo.data.gouv.fr |
Je ne suis pas sûr de bien interpréter ta réponse. Je précise donc notre situation : nous aurions un même dataset référencé dans CKAN (selon un modèle de métadonnées CKAN / non ISO 19139) et dans un catalogue GeoNetwork (ISO 19139). Les 2 seraient moissonnés respectivement par udata et par geo.data.gouv.fr. En l'état actuel les deux pourraient se retrouver dans data.gouv.fr alors qu'il s'agirait d'un même dataset même si les 2 portaient le même identifiant ? La solution que tu évoques pour le moissonneur ODS c'est ça : |
C'est un champ chez eux qui indique si le jeux de données provient de métadonnées ISO 19139. |
Du coup, si on a un double moissonnage via CKAN et GeoNetwork, on aura des doublons des data.gouv.fr ou est-ce qu'il y a un contrôle d'unicité dans data.gouv.fr ? |
Il y aura des doublons si rien n’est fait.
Le mer. 17 oct. 2018 à 13:12, Benjamin C. <[email protected]> a
écrit :
… Du coup, si on a un double moissonnage via CKAN et GeoNetwork, on aura des
doublons des data.gouv.fr ou est-ce qu'il y a un contrôle d'unicité dans
data.gouv.fr ?
—
You are receiving this because you commented.
Reply to this email directly, view it on GitHub
<#780 (comment)>,
or mute the thread
<https://github.com/notifications/unsubscribe-auth/ABLJgD1rrTMHtyX0-8_OfJHm90kx6fNsks5ulxCYgaJpZM4Xjjvv>
.
|
Merci, bien compris. |
Je me pose la question de ce qu'il se passe si un même jeu de données est moissonné par udata à la fois via le moissonneur CKAN et geo.data.gouv.fr. J'imagine qu'il y a un risque de doublon. Peut-on éviter cela (via l'identificateur de ressource unique des métadonnées ISO 19139 qui devrait correspondre à l'id du dataset dans CKAN par exemple) ?
The text was updated successfully, but these errors were encountered: