Labo LAMA-WeST

Intelligence artificielle
Traitement de la langue naturelle
Web sémantique

Annotations sémantiques et analyse de surface pour l’extraction de graphes d’abstraction de débats politiquese

Étudiant: Philippe Armel N'Techobo

Directeur(e): Amal Zouaq

Co-directeur(e)(s): Michel Gagnon

De nombreux gouvernements ont pris des initiatives pour ouvrir et partager leurs données telles que les débats parlementaires. Ce type de corpus est généralement très grand, couvre plusieurs thématiques et n'est pas toujours organisé de manière linéaire. Dans ce travail de recherche, nous proposons une méthode pour extraire automatiquement des représentations abstraites basées sur des graphes qui représentent les sujets discutés durant les débats politiques et les relations qui existent entre ces sujets. À cette fin, nous exploitons des annotateurs sémantiques basés sur le Linked Data pour l'extraction des entités concernées. De cette façon, nous pouvons représenter les sujets discutés avec des concepts dont la sémantique a déjà été définie dans le Linked Data de manière structurée, à la différence des méthodes existantes qui utilisent de simples mots clés. Aussi, nous extrayons des relations entre les concepts provenant du Linked Data et des relations de haut niveau entre ces entités provenant du corpus de débats. Ces dernières sont extraites avec des patrons d’analyse morphosyntaxiques, définis manuellement, et désambiguïsées en utilisant VerbNet. Avec les concepts et relations extraits, nous construisons un graphe abstrait qui représente le débat. Ce graphe est ensuite réduit en fonction de plusieurs paramètres pour ne conserver que les entités et relations les plus importantes. Le graphe généré, en plus de permettre la recherche sémantique, pourrait être réutilisé par d’autres systèmes pour la génération de résumé abstractif ou effectuer des systèmes de réponses à des questions (question answering systems).

Pour plus d'informations, cliquez ici

Publications

2016

Semantic Annotation for the Analysis of Political Debates: A Graph-based Approach

Edoukou Philippe Armel N'Techobo, Amal Zouaq, Michel Gagnon

International Conference on the Advances in Computational Analysis of Political Text, Dubrovnik