Simplification de schémas d'annotation : un aller sans retour ?
Résumé
Dans cet article, nous comparons l'impact de la simplification d'un schéma d'annotation sur un système de repérage d'entités nommées (REN). Une simplification consiste à rassembler les types d'entités nommées (EN) sous deux types génériques (personne et lieu), l'autre revient à mieux définir chaque type d'EN. Nous observons une amélioration des résultats sur les deux versions simplifiées. Nous étudions également la possibilité de retrouver le niveau de détail des types d'EN du schéma d'origine à partir des versions simplifiées. L'utilisation de règles de conversion permet de recouvrer les types d'EN d'origine, mais il reste une forme d'ambiguïté contextuelle qu'il est impossible de lever au moyen de règles. ABSTRACT Annotation scheme simplification : a one way trip with no return ? In this paper, we study the impact of annotation scheme simplification on named entity recognition (NER) performances. One simplification consists in merging all named entity (NE) types into two main types (person and location), while the other simplification relies on a better definition of all NE types. We achieved better results on the two simplified versions of the annotation scheme. We also study the ability to recover the original NE types from the simplified versions. The use of post-processing rules allows to recover a few original NE types. Nevertheless, we faced with a kind of contextual ambiguity which seems hard to process using rules.
Origine : Fichiers produits par l'(les) auteur(s)
Loading...