Un terme est une structure linguistique (un mot ou un groupe de mots) qui dénote un concept. YaTeA (Yet Another Term ExtrActor) permet d’identifier dans un corpus des groupes nominaux qui peuvent correspondre à des termes (c.-à-d. des candidats de terme). Cet outil a été développé par Thierry Hamon et Sophie Aubin au LIPN dans le cadre du projet ALVIS. YaTeA peut également prendre en entrée une ressource terminologique externe.
Installation de YaTeA (en étant root) :-
Configurer le module CPAN / Invoquer le shell :
> perl -MCPAN -we 'shell'
-
Installer les modules dont YaTeA dépend (quit pour quitter le shell CPAN)
cpan> install YAML
cpan> install Config::General
cpan> install Parse::Yapp
cpan> install Module::Build
cpan> quit -
Télécharger Lingua-YaTeA-0.5.tar.gz :
http://search.cpan.org/~thhamon/Lingua-YaTeA-0.5/ -
Le décompresser
> tar -xvzf Lingua-YaTeA-0.5.tar.gz
-
Installer YaTe
> perl Makefile.PL
> make
> make test
> make install -
Vérifier que l’installation à bien copié les répertoires etc/yatea/, share/doc/ et share/YaTeA. Sinon, c’est à vous de le faire :
> cp -r etc/yatea /usr/local/etc/.
> cp -r share/doc /usr/local/share/.
> cp -r share/YaTeA /usr/local/share/.
YaTeA prend en entrée un corpus tabulaire produit par TreeTagger. Pour exécuter YaTeA, il suffit de taper la commande suivante :
yatea.rc est le fichier de paramétrage du traitement. Un exemple se trouve dans /usr/local/etc/yatea/yatea.rc. En fonction de votre installation, ce fichier doit contenir les lignes suivantes :
Si le corpus est en français plutôt qu’en anglais, il suffit de remplacer EN par FR.
YaTeA créer un répertoire portant le même nom que le corpus spécifié pour y stocker les résultats du traitement.
> yatea -rcfile yatea.rc corpus.ttg
yatea.rc est le fichier de paramétrage du traitement. Un exemple se trouve dans /usr/local/etc/yatea/yatea.rc. En fonction de votre installation, ce fichier doit contenir les lignes suivantes :
CONFIG_DIR = /usr/local/share/YaTeA/config
LOCALE_DIR = /usr/local/share/YaTeA/locale
language = EN
Si le corpus est en français plutôt qu’en anglais, il suffit de remplacer EN par FR.
YaTeA créer un répertoire portant le même nom que le corpus spécifié pour y stocker les résultats du traitement.
hi, good work I am intrested in your application so if you can send me an other version for windows
paipo.java@gmail.com
I'm not the author of this NLP tool. The authors are Thierry Hamon and Sophie Aubin and YaTeA is downloadable on CPAN (http://search.cpan.org/~thhamon/Lingua-YaTeA-0.5/).