Labo LAMA-WeST

Intelligence artificielle
Web sémantique
Traitement de la langue naturelle

Amélioration des performances des annotateurs sémantiques

Étudiant: Mohamed Chabchoub

Directeur(e): Amal Zouaq

Co-directeur(e)(s): Michel Gagnon

Les annotateurs sémantiques jouent un rôle important dans la transition du Web actuel au Web sémantique. Ils s’occupent d’extraire des informations structurées à partir de textes bruts, permettant ainsi de pointer vers des bases des connaissances telles que DBpedia, YAGO ou Babelnet. De nombreuses compétitions sont organisées chaque année pour promouvoir les travaux de recherche de ce domaine. Nous présentons dans ce mémoire notre participation à la compétition Open Knowledge Extraction que nous avons remportée à la conférence European Semantic Web Conference 2016. Dans le cadre de cette compétition, nous avons implémenté une approche générique que nous avons testée sur quatre annotateurs sémantiques. Nous nous concentrons dans ce mémoire à décrire un annotateur sémantique en particulier, DBpedia Spotlight. Nous exposons les différentes limites que présente cet annotateur ainsi que les approches que nous avons développées pour y remédier. Nous avons noté une augmentation d’une moyenne de 20% des performances actuelles de DBpedia Spotlight en testant sur différents corpus. Ces derniers proviennent principalement de journaux internationaux, "Reuters News Stories", "MSNBC" et le "New York Times".

Pour plus d'informations, cliquez ici

Publications

2016
June

Collective disambiguation and Semantic Annotation for Entity Linking and Typing

Mohamed Chabchoub, Michel Gagnon, Amal Zouaq

ESWC-16 Open Knowledge Extraction Challenge, Heraklion, Greece