L'Entity Linking (EL) est une tâche consistant à détecter (i.e. reconnaissance des entités nommées) et associer des entités nommées dans un texte à des entrées dans une base de connaissances (liaison d'entités nommées). Appliquée à Twitter, cette tâche est complexe en raison de la concision, des abréviations et des erreurs grammaticales. Pour résoudre la NEL, une approche multifactorielle innovante, intégrant des facteurs comme la distance de Levenshtein ou le plus court chemin est proposée, ainsi qu'une hypothèse liant sémantiquement les entités consécutives. Cette approche diffère des méthodes d'apprentissage profond traditionnelles, omniprésente dans la littérature actuelle. Un corpus d'évaluation spécifique a été créé contenant 568 conversations Twitter composées de 2000 tweets. L'objectif est de tirer le meilleur parti du contexte des tweets pour améliorer les performances de l'EL dans le contexte de données Twitter en français.
- Poster