Étude de transférabilité des clés pour le liage de données entre graphes de connaissances - Données et Connaissances Massives et Hétérogènes Accéder directement au contenu
Communication Dans Un Congrès Année : 2023

Étude de transférabilité des clés pour le liage de données entre graphes de connaissances

Résumé

Data linking in knowledge graphs is a crucial and long-standing problem; it involves finding links between descriptions of entities in these graphs that refer to the same real-world entity. Keys, which are subsets of properties that identify each entity, are important elements in finding these identity links. The classical key-based approach if data linking is based on the discovery of a set of keys in each graph, and then apply a merge (e.g. intersection) of these keys. But this approach can be very time consuming and can sometimes lead to very few common keys between the two graphs. In this work, in order to reduce the computational complexity of the data linking task using keys, we study the issue of transferability of keys discovered in one graph to another graph. More precisely, we conducted experiments on DBpedia and Wikidata in order to evaluate the performance impact of key transferability both in terms of computation time and quality of transferred keys.
Le liage de données dans des graphes de connaissances est un problème crucial et de longue date ; il consiste à déterminer des liens entre les descriptions des entités de ces graphes désignant une même entité du monde réel. Les clés, qui sont des sous-ensembles de propriétés permettant d'identifier chaque instance d'un graphe, sont des éléments importants pour la découverte de ces liens d'identité. L'approche classique de liage de données fondée sur les clés consiste à découvrir un ensemble de clés dans chaque graphe, et ensuite appliquer une procédure de fusion (e.g., le produit cartésien des clés). Mais cette approche peut être très coûteuse en temps et peut parfois conduire à très peu de clés communes entre les deux graphes. Dans ce travail, afin
Fichier principal
Vignette du fichier
IC_2023_paper_33-5.pdf (257.54 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-04152691 , version 1 (05-07-2023)

Licence

Paternité

Identifiants

  • HAL Id : hal-04152691 , version 1

Citer

Thibaut Soulard, Fatiha Saïs, Joe Raad, Gianluca Quercini. Étude de transférabilité des clés pour le liage de données entre graphes de connaissances. 34es Journées francophones d'Ingénierie des Connaissances (IC 2023) @ Plate-Forme Intelligence Artificielle (PFIA 2023), Jul 2023, Strasbourg, France. ⟨hal-04152691⟩
32 Consultations
33 Téléchargements

Partager

Gmail Facebook X LinkedIn More