YaTeA : un extracteur de candidats terme

Un terme est une structure linguistique (un mot ou un groupe de mots) qui dénote un concept. YaTeA (Yet Another Term ExtrActor) permet d’identifier dans un corpus des groupes nominaux qui peuvent correspondre à des termes (c.-à-d. des candidats de terme). Cet outil a été développé par Thierry Hamon et Sophie Aubin au LIPN dans le cadre du projet ALVIS. YaTeA peut également prendre en entrée une ressource terminologique externe.

Installation de YaTeA (en étant root) :
  • Configurer le module CPAN / Invoquer le shell :
    > perl -MCPAN -we 'shell'
  • Installer les modules dont YaTeA dépend (quit pour quitter le shell CPAN)
    cpan> install YAML
    cpan> install Config::General
    cpan> install Parse::Yapp
    cpan> install Module::Build
    cpan> quit
  • Télécharger Lingua-YaTeA-0.5.tar.gz :
    http://search.cpan.org/~thhamon/Lingua-YaTeA-0.5/
  • Le décompresser
    > tar -xvzf Lingua-YaTeA-0.5.tar.gz
  • Installer YaTe
    > perl Makefile.PL
    > make
    > make test
    > make install
  • Vérifier que l’installation à bien copié les répertoires etc/yatea/, share/doc/ et share/YaTeA. Sinon, c’est à vous de le faire :
    > cp -r etc/yatea /usr/local/etc/.
    > cp -r share/doc /usr/local/share/.
    > cp -r share/YaTeA /usr/local/share/.
Utilisation de YaTeA
YaTeA prend en entrée un corpus tabulaire produit par TreeTagger. Pour exécuter YaTeA, il suffit de taper la commande suivante :
> yatea -rcfile yatea.rc corpus.ttg
yatea.rc est le fichier de paramétrage du traitement. Un exemple se trouve dans /usr/local/etc/yatea/yatea.rc. En fonction de votre installation, ce fichier doit contenir les lignes suivantes :
CONFIG_DIR = /usr/local/share/YaTeA/config
LOCALE_DIR = /usr/local/share/YaTeA/locale
language = EN

Si le corpus est en français plutôt qu’en anglais, il suffit de remplacer EN par FR.
YaTeA créer un répertoire portant le même nom que le corpus spécifié pour y stocker les résultats du traitement.
Cette entrée a été publiée dans TALN. Placez un signet sur le permalien.

2 Responses to YaTeA : un extracteur de candidats terme

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *