Evaluating resource acquisition tools for Information Extraction
Proceedings of the Third International Conference on Language Resources and Evaluation (LREC 2002)
Abstract
This paper evaluates two different approaches for the elaboration of semantic classes. The framework is an Information Extraction, which needs large amount of domain-dependent resources. An endogenous approach (corpus-based learning) is contrasted with a heterogeneous one (the use of a large semantic network). The two techniques are evaluated. Cet article vise à évaluer deux approches différentes pour la constitution de classes sémantiques. Nous nous plaçons dans la perspective d’une application d’extraction d’information, pour laquelle la notion de classe sémantique est primordiale. Une approche endogène (acquisition à partir d’un corpus) est contrastée avec une approche exogène (à travers un réseau sémantique riche). L’article présente une évaluation fine de ces deux techniques et leur complémentarité possible.