Main Page
Bienvenue sur DataCegeSoma, un prototype de base de connaissance collaborative pour le CegeSoma/Archives de l'État.
Elle vous donne accès aux données d'autorité Personnes physiques du CegeSoma sous forme de données structurées.
L'instance Wikibase que vous avez sous les yeux est un work in progress : elle est destinée à être enrichie et améliorée au cours des mois à venir, merci de votre compréhension.
Contexte
Ce prototype a été réalisé par Anne Chardonnens dans le cadre du projet de recherche Adochs. Il répond à différents besoins :
- centralisation de données disparates
- attribution d'identifiants pérennes
- gestion de données multilingues
- publication des données dans un format structuré
- création de liens vers des ressources externes
- édition collaborative en temps réel
- outils de gestion et maintenance
- import automatisé de nouveaux jeux de données
Exemples
Voici quelques exemples d'Entités Personne contenues dans cette Wikibase (à venir) :
Données
Ces données d'autorité relatives aux grands conflits du XXème siècle et dispersées jusque là dans diverses bases de données, fichiers Excel ou xml, ont fait l'objet d'un travail de nettoyage, de réconciliation et d'alignement avec des référentiels issus du web de données, avant d'être publiées ici de façon centralisée selon le modèle de données Wikibase (...).
Personnes
Lieux
Les noms de lieux proviennent d'un assemblage de trois sources :
- Wikidata
- l'Institut national de statistiques
- un référentiel utilisé par les Archives de l'Etat
À noter (traductions)
- Dans la mesure du possible, ce prototype vise à fournir des labels et descriptions dans les trois langues nationales belges (néerlandais, français et allemand) ainsi qu'en anglais. Il est toutefois possible que certains termes ou certaines descriptions n'aient pas encore fait l'objet d'un contrôle ou d'une traduction (à l'instar de cette page d'accueil), merci de votre compréhension !
- Par ailleurs, dans certains cas, des labels ont été générés dans l'une de ces langues à partir de noms en français ou néerlandais (langue des données d'origine), faute de mieux. Dans un premier temps, il nous semble en effet préférable d'avoir une occurrence non traduite plutôt qu'un silence dans certaines langues.
Recherche
Recherche libre
La recherche libre permet d'effectuer (dans l'onglet de recherche en haut à droite) une recherche dans toute la Wikibase à l'aide d'une chaîne de caractères, en profitant d'une fonctionnalité d'autosuggestion. Il existe également un mode de recherche avancée, permettant d'affiner la recherche.
Recherche structurée
La recherche structurée tire parti du fait que les données sont encodées dans un format lisible par des machines. Grâce à une requête SPARQL, il est possible d'effectuer des recherches beaucoup plus élaborées.
Exemples de requêtes SPARQL (à venir) :
- Toutes les personnes avec toutes les informations disponibles sur elles
- Toutes les personnes 'sujet de'
- Toutes les personnes 'producteurs de'
- Toutes les cotes archivistiques accompagnées de leur identifiant Wikibase en vue de nouveaux ajouts (instance of 'référence SAM')
- Toutes les propriétés, avec leur description, leurs alias et leur type
Requêtes SPARQL fédérées
Pour aller plus loin encore, il est possible d'interroger simultanément plusieurs bases de connaissance grâce aux requêtes SPARQL fédérées.
Exemples de requête SPARQL fédérées (à venir) :
- Avec Wikidata
- Avec The EU Knowledge Graph
Enrichissement des données
L'enrichissement des données à l'aide de nouvelles informations peut se faire manuellement ou de façon semi-automatisée.
- L'import se fait avec une adaptation (csv2WikibaseEdit) du scripts JS [1]
Accéder aux données (à venir)
Cette plateforme met à disposition des données d’autorité sous une forme structurée et accessible par des programmes informatiques grâce à une API et un SPARQL endpoint.
Utile
Configuration / documentation
WBRepoSettings
- pour ordonner l'ordre d'apparition des propriétés $wgWBRepoSettings['propertyOrderUrl'] = 'https://wikibase.url/w/index.php?title=MediaWiki:Wikibase-SortedProperties&action=raw&sp_ver=1'; // Pour décider de l'ordre de l'affichage des déclarations (par défaut : ordre d'ajout)
- pour créer des sections de propriétés ....
Droits et accès
Extensions
- Récap extensions utilisées
- Vue détaillée
- ConfirmEdit (permet de limiter les spams en utilisant un Captcha lors de la création de comptes)
- Traitement des SPAM, à explorer :
-
- Nuke (permet de supprimer en masse des pages)
- Block et BlockList
- $wgNamespaceProtection
- Controle Access
Gadgets
- Récap gadgets utilisés
- Vue détaillée
- https://adochs.arch.be/wiki/MediaWiki:Gadget-LinguaImporter.js (working)
- https://adochs.arch.be/wiki/MediaWiki:Gadget-Descriptions.js (working, à activer dans les pref)
- https://adochs.arch.be/wiki/MediaWiki:Gadget-Merge.js (working, à activer dans les pref)
- et surtout !! https://adochs.arch.be/w/index.php?title=MediaWiki:Gadgets-definition (relancer la Wikibase pour que les modifs soient prises en compte)
- ajouter quick presets ? https://wiki.personaldata.io/wiki/MediaWiki:Gadget-QuickPresets/defaultconf.js & https://wiki.personaldata.io/wiki/MediaWiki:Gadget-QuickPresets.js
- ajouter easy query (adapter liens Wikidata) : https://wiki.personaldata.io/wiki/MediaWiki:Gadget-EasyQuery.js
- évent. derived statement (inverse label item) https://forum.personaldata.io/t/a-little-present-in-this-festive-season/213