
UIMA (Unstructured Information Management Architecture) est un framework de développement et de déploiement d'applications de traitement des données non structurées. Lancé par IBM, et maintenant en incubation à la fondation Apache, UIMA est en cours de normalisation à l'OASIS (Organization for the Advancement of Structured Information Standards). L'objectif de ce framework est de proposer une architecture supportant les différentes étapes du traitement d'un document non structuré (texte, image, vidéo, etc.) en vue d'en extraire de façon automatique des informations structurées. UIMA ne décrit ni comment ces informations doivent être extraites du texte, ni la façon de s'en servir. Par contre, cette plate-forme de développement prend en charge de nombreuses problématiques de façon native comme la réutilisation de composants, la montée en charge et le déploiement distribué, la prise en compte des erreurs, la mise en œuvre de services web, etc.
Introduction à UIMA
Description des éléments clefs d'UIMA

- Le schéma d’annotation commun (Common Analysis Structure ou CAS)
- Le système de types (Type System ou TS)
- Composant d’annotation (Analysis Engine ou AE)
- Annotateur (Annotator)
- Descripteur XML de composant (Component Descriptors)
- La chaîne de traitement UIMA (Collection Processing Engine ou CPE)
- CAS vs. JCAS
Installation d'UIMA
Premiers pas avec UIMA

- Tutoriel UIMA I : création d'un composant d'annotation (Analysis Engine) en utilisant le JCas
- Tutoriel UIMA I (variante) : code de l’annotateur utilisant directement le CAS plutôt que le JCas
- Tutoriel UIMA II : paramétrage d'un composant d'annotation
- Tutoriel UIMA III : enchaîner des composants d'annotation
- Tutoriel UIMA IV : Parcourir des annotations en utilisant le JCas
- Tutoriel UIMA V : Parcourir des annotations en utilisant le CAS
Trucs & Astuces
- Manipuler une application développée sous Eclipse sans Eclipse
- Messages d’erreur : java.lang.OutOfMemoryError: java heap space
Autres informations
- Tutoriel (et environnement) d’introduction à UIMA proposé par le LINA lors de l’édition 2009 des Rencontres Mondiales du Logiciel Libre (RMLL)
- Quelques liens pertinents concernant UIMA
- Diapositives d'une présentation d'UIMA faite dans le cadre du projet DaFOE
- Documentation du SDK UIMA
- Tous les billets concernant UIMA sur ce blog
Télécharger le tutoriel complet au format pdf (généré le 22 mars 2012)