Difference between revisions of "Main Page"

From wikibase-docker
Jump to navigation Jump to search
Line 68: Line 68:
 
** Obtenir une liste des 'personnes' stockées dans la Wikibase, accompagnées de leur occupation / parti politique / distinctions reçues si l'information est disponible sur Wikidata. [https://tinyurl.com/y8fsm869 -> Essayez !]
 
** Obtenir une liste des 'personnes' stockées dans la Wikibase, accompagnées de leur occupation / parti politique / distinctions reçues si l'information est disponible sur Wikidata. [https://tinyurl.com/y8fsm869 -> Essayez !]
 
** Idem, mais en groupant les valeurs multiples dans une même cellule pour une meilleure lisibilité. [https://tinyurl.com/ydz6vnne -> Essayez !]
 
** Idem, mais en groupant les valeurs multiples dans une même cellule pour une meilleure lisibilité. [https://tinyurl.com/ydz6vnne -> Essayez !]
** Idem pour une personne en particulier (si cela ne fonctionne pas pour des raisons de performance) [https://tinyurl.com/ybw8uked -> Essayez !]
+
** Rechercher, pour une personne en particulier, si Wikidata possède des informations sur son occupation / parti politique / distinction reçue / institutions possédant des archives à son sujet (si cela ne fonctionne pas pour des raisons de performance) [https://tinyurl.com/ycqun8r2 -> Essayez !]
  
 
* Avec The EU Knowledge Graph
 
* Avec The EU Knowledge Graph

Revision as of 14:41, 23 June 2020


Bienvenue sur DataCegeSoma, un prototype de base de connaissance collaborative pour le CegeSoma/les Archives de l'État en Belgique. Elle vous donne accès aux données d'autorité Personnes physiques du CegeSoma sous forme de données structurées.

L'instance Wikibase que vous avez sous les yeux est un work in progress : elle est destinée à être enrichie et améliorée au cours des mois à venir, merci de votre compréhension.

Contexte

Ce prototype a été réalisé par Anne Chardonnens dans le cadre du projet de recherche Adochs. Il répond à différents besoins :

  • centralisation de données disparates
  • attribution d'identifiants pérennes
  • gestion de données multilingues
  • publication des données dans un format structuré
  • création de liens vers des ressources externes
  • édition collaborative en temps réel
  • outils de gestion et maintenance
  • import automatisé de nouveaux jeux de données

Exemples

Voici quelques exemples d'Entités Personne contenues dans cette Wikibase (à venir) :

Données

Ces données d'autorité relatives aux grands conflits du XXème siècle et dispersées jusque là dans diverses bases de données, fichiers Excel ou xml, ont fait l'objet d'un travail de nettoyage, de réconciliation et d'alignement avec des référentiels issus du web de données, avant d'être publiées ici de façon centralisée selon le modèle de données Wikibase (...).

Personnes

Lieux

Les noms de lieux proviennent d'un assemblage de trois sources :

  • Wikidata
  • l'Institut national de statistiques
  • un référentiel utilisé par les Archives de l'Etat

À noter (traductions)

  • Dans la mesure du possible, ce prototype vise à fournir des labels et descriptions dans les trois langues nationales belges (néerlandais, français et allemand) ainsi qu'en anglais. Il est toutefois possible que certains termes ou certaines descriptions n'aient pas encore fait l'objet d'un contrôle ou d'une traduction (à l'instar de cette page d'accueil), merci de votre compréhension !
  • Par ailleurs, dans certains cas, des labels ont été générés dans l'une de ces langues à partir de noms en français ou néerlandais (langue des données d'origine), faute de mieux. Dans un premier temps, il nous semble en effet préférable d'avoir une occurrence non traduite plutôt qu'un silence dans certaines langues.

Recherche

Recherche libre

La recherche libre permet d'effectuer (dans l'onglet de recherche en haut à droite) une recherche dans toute la Wikibase à l'aide d'une chaîne de caractères, en profitant d'une fonctionnalité d'autosuggestion. Il existe également un mode de recherche avancée, permettant d'affiner la recherche.

Recherche structurée

La recherche structurée tire parti du fait que les données sont encodées dans un format lisible par des machines. Grâce à une requête SPARQL, il est possible d'effectuer des recherches beaucoup plus élaborées.

Exemples de requêtes SPARQL (travail en cours) :

  • Tous les lieux situés en Belgique (nom et description en français), accompagnés de leur identifiant AGR, ainsi que de leur code INS et identifiant Wikidata s'ils sont disponibles -> Essayez !
  • Tous les lieux situés en Belgique (en français), accompagnés de leur identifiant AGR et code INS lorsqu'ils sont disponbiles et disposés sur une carte -> Essayez !
  • Toutes les propriétés, avec leur description, leurs alias et leur type -> Essayez !
  • Toutes les personnes avec toutes les informations disponibles sur elles
  • ...

Requêtes SPARQL fédérées

Pour aller plus loin encore, il est possible d'interroger simultanément plusieurs bases de connaissance grâce aux requêtes SPARQL fédérées.

Exemples de requête SPARQL fédérées (work in progress) :

  • Avec Wikidata
    • Obtenir une liste des 'lieux' stockés dans la Wikibase accompagnés de la taille de leur population selon Wikidata, si l'information est disponible. -> Essayez !
    • Obtenir une liste des 'personnes' stockées dans la Wikibase, accompagnés des noms des institutions possédant des archives à leur sujet (P485) selon Wikidata, si l'information est disponible. -> Essayez !
    • Idem, mais avec le numéro d'inventaire s'il est donné et avec un regroupement des valeurs multiples dans une même cellule pour une meilleure lisibilité. -> Essayez !
    • Obtenir une liste des 'personnes' stockées dans la Wikibase, accompagnées de leur 'occupation' selon Wikidata, si l'information est disponible. -> Essayez !
    • Obtenir une liste des 'personnes' stockées dans la Wikibase, accompagnées de leur occupation / parti politique / distinctions reçues si l'information est disponible sur Wikidata. -> Essayez !
    • Idem, mais en groupant les valeurs multiples dans une même cellule pour une meilleure lisibilité. -> Essayez !
    • Rechercher, pour une personne en particulier, si Wikidata possède des informations sur son occupation / parti politique / distinction reçue / institutions possédant des archives à son sujet (si cela ne fonctionne pas pour des raisons de performance) -> Essayez !
  • Avec The EU Knowledge Graph

Enrichissement des données

L'enrichissement des données à l'aide de nouvelles informations peut se faire manuellement ou de façon semi-automatisée.

  • L'import se fait avec une adaptation (csv2WikibaseEdit) du scripts JS [1]

Accéder aux données (à venir)

Cette plateforme met à disposition des données d’autorité sous une forme structurée et accessible par des programmes informatiques grâce à une API et un SPARQL endpoint.

Utile


Configuration / documentation

Sidebar

  • lien pour modifier la barre de navigation
  • pour que 'page au hasard' renvoie vers un élément plutôt qu'une "page" : sur cette page remplacer "Special:Random" par "Special:Random/Item"

WBRepoSettings

Droits et accès

Extensions

  • ConfirmEdit (permet de limiter les spams en utilisant un Captcha lors de la création de comptes)
  • Traitement des SPAM, à explorer :
  • Nuke (permet de supprimer en masse des pages)
  • Block et BlockList
  • $wgNamespaceProtection
  • Controle Access

Gadgets

  • Gadget-Descriptions permet de visualiser (dans les déclarations) la description d'une propriété en passant la souris dessus (opérationnel)
  • Ce script permet d'afficher le label et la description d'un élément issu de Wikidata (opérationnel)
  • Gadget-Merge permet de fusionner deux éléments (opérationnel)
  • Duplicate References (nb: ajouter aussi .css en plus du .js) permet de copier-coller une référence (opérationnel... mais ne fonctionne que pour les références au sein d'une même propriété (ex. taille de la population))
  • EasyQuery permet, après adaptation du code créé à la base pour Wikidata (cf. code ici), d'ajouter une icone (trois petits points apparaissent à droite de la valeur d'une propriété) permettant en un clic de trouver d'autres éléments possédant la même combinaison proriété+valeur (opérationnel, sauf pour les "external-id" cf. ici, il faudrait pouvoir le désactiver...)
  • ajouter quick presets ? (voir aussi)
  • évent. derived statement (inverse label item)
  • il pourrait être intéressant d'intégrer le gadget permettant d'afficher dans le champ de recherche une description créée à partir des déclarations de l'élément (par exemple si la description est inexistante dans une certaine langue), mais cela nécessite d'adapter beaucoup d'éléments... cf. Autodesc